El modelo de lenguaje cubano avanza como proyecto de soberanía tecnológica y defensa de la identidad nacional.
CecilIA no
es solo el nombre de una novela cubana del siglo XIX. En pleno 2025, es también
la apuesta de un grupo de científicos, profesores y estudiantes de la
Universidad de La Habana por desarrollar un modelo de lenguaje de inteligencia
artificial cubano, pensado desde Cuba, con datos cubanos y al servicio del
país. En un contexto global dominado por tecnologías entrenadas con sesgos
culturales, intereses corporativos y en idiomas hegemónicos, CecilIA surge
como alternativa soberana y con identidad.
El modelo, entrenado inicialmente con textos
literarios cubanos, prensa nacional, discursos políticos y la Gaceta Oficial,
ya ha comenzado a mostrar resultados. Su desarrollo ha sido impulsado por
el Grupo de Inteligencia Artificial y Ciencia de Datos de la Facultad de
Matemática y Computación (Matcom), y tiene como objetivo final que la IA
en Cuba hable y entienda “en cubano”.
Durante su segunda presentación pública, esta
vez en la sede de la Unión Nacional de Juristas de Cuba, se compartieron
avances técnicos, pero sobre todo, se insistió en algo fundamental: sin datos
cubanos, no hay IA verdaderamente cubana. Por eso, los desarrolladores invitan
a instituciones, medios, juristas y artistas a sumar documentos, guiones,
canciones, noticias y textos legales que permitan nutrir el modelo.
Un proyecto colectivo, desde Cuba y para
Cuba
El modelo CecilIA se basa en lo que los
especialistas llaman «modelos de lenguaje pequeños» (SLM), que
requieren menos recursos y son ideales para países en desarrollo. A partir del
modelo base Salamandra (también en español), el equipo cubano realizó un
entrenamiento continuo con corpus propios, y ahora trabaja en el diseño de
instrucciones cubanas que permitan afinar la interacción y adaptar mejor las
respuestas del modelo.
El Dr. Yudivián Almeida, uno de sus líderes,
anunció que se espera construir un corpus con al menos 10 000 instrucciones
específicas, muchas de las cuales podrán ser propuestas de manera abierta por
cualquier persona interesada. Esto apunta a una IA colaborativa, arraigada
en los saberes del pueblo.
Pero el reto no es solo técnico. Desde el
equipo se subraya la importancia de la ética, la prevención de
sesgos, la explicación y la necesidad urgente de digitalizar documentos
patrimoniales. Bibliotecas, editoriales y archivos aún tienen valiosa información
solo en papel, lo cual limita el acceso y uso para fines de entrenamiento de IA.
Más allá del desarrollo de software, el
proyecto CecilIA tiene una dimensión cultural profunda: proteger la
identidad cubana en un mundo donde los algoritmos suelen ignorar los
matices del Sur Global. La posibilidad de crear aplicaciones de IA que
reconozcan el habla, los conceptos y las referencias culturales del país
representa una herramienta estratégica para la soberanía informativa.
Durante el encuentro en La Habana, juristas,
lingüistas, sociólogos y científicos coincidieron en la necesidad de que todas
las disciplinas aporten a este tipo de proyectos. No solo para garantizar
calidad técnica, sino para que el resultado final esté alineado con los
valores sociales, culturales y éticos de la nación.
CecilIA es una muestra de lo que puede lograrse
desde una universidad pública y un sistema científico comprometido. Pero su
éxito dependerá de que toda la sociedad entienda que la transformación
digital no es un lujo, sino una necesidad nacional. Mientras el trabajo
continúa, el modelo ya inspira a otros equipos en todo el país. Como dijeron al
cerrar la presentación: “crecimos en todo”. // Fuente: TELESUR