CENIA: El alfil chileno para la IA

Chile aspira a transformarse en un líder latinoamericano en inteligencia artificial. Para ello ha creado un centro dedicado a desarrollar capacidades en este sector y, en colaboración con diversas universidades, busca crear la primera aplicación computacional de IA nativa de América Latina pensada para las demandas y necesidades de la región.

Por Carlos de la Vega  
__

Agencia TSS – La cuestión de la inteligencia artificial (IA) se ha tornado ubicua. Es uno de los temas más abordados desde los medios de comunicación masivos hasta los espacios de los expertos de múltiples disciplinas y, por supuesto, los ámbitos de los gobiernos nacionales y los organismos multilaterales. El liderazgo inicial fue de Estados Unidos con empresas y entidades privadas como Google y su sistema Gemini, o el popularísimo ChatGPT de OpenIA. Pero como todo últimamente, el trono parece estar desplazándose rápidamente al lejano Oriente. En pocos días, luego de que la compañía china DeepSeek lanzara el 10 de enero de 2025 su bot conversacional (aplicaciones de software capaces de mantener una conversación con humanos) DeepSeek-R1, el universo de la IA se revolucionó. DeepSeek había logrado una aplicación al menos tan potente como ChatGPT a una fracción del costo económico y sin la necesidad de los descomunales sistemas de servidores informáticos (hardware) empleados por los norteamericanos. DeepSeek tampoco fue una “golondrina china solitaria”, detrás de ella apareció Qwen2.5, de Alibaba, y vienen marchando otros.

En este sector, América Latina está en una periferia muy marcada. Aunque no faltan especialistas de talla internacional, principalmente en países como la Argentina, Brasil, México, Chile y Colombia, la carencia de recursos económicos y materiales para el desarrollo de estos sistemas, en la escala en la que ellos los demandan, condena al subcontinente, como tantas otras veces ha ocurrido, y ocurre, a ser mucho más un consumidor de la tecnología que un productor o director de ella.

El Centro Nacional de Inteligencia Artificial (CENIA), situado en la ciudad de Santiago de Chile, es el intento del gobierno trasandino por dar una respuesta superadora a esta situación, con la intención de transformarse en un líder regional en IA apalancado fuertemente para ello en la cooperación con otros países e instituciones latinoamericanas.

Génesis, propósito y estructura

El CENIA comenzó oficialmente su actividad el 7 de diciembre de 2021 conformado por cuatro universidades, la Universidad de Chile, la Pontificia Universidad Católica de Chile, la Universidad Técnica Federico Santa María y la Universidad Adolfo Ibáñez. En la actualidad, cuenta con otras ocho instituciones universitarias asociadas más (Universidad Andrés Bello, Universidad de Talca, Universidad de Concepción, Universidad San Sebastián, Universidad de los Andes, Universidad Católica del Norte, Universidad de Tarapacá y Universidad de la Serena). El CENIA se encuentra bajo la órbita de la Agencia Nacional de Investigación y Desarrollo (ANID) del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación de Chile. Es “una institución que nace fundada por cuatro universidades del país, pero con una vocación nacional en el sentido de poder incluir a la mayor cantidad de gente relacionada con la inteligencia artificial y que pueda apoyar el desarrollo de su ecosistema tanto en Chile como también en la región”, explicó Álvaro Soto, director del CENIA, a TSS en una videoconferencia.

El CENIA es una corporación sin fines de lucro constituida bajo la ley chilena y que, si bien fue fundada por las cuatro universidades mencionadas, recibe financiamiento tanto público, como privado. Tres son los ejes de la actividad de la institución: la investigación, la transferencia tecnológica y la vinculación.

En el campo de la investigación, el Centro posee un staff de investigadores contratados directamente por él y otro de investigadores asociados dedicados a temas de IA. En lo que respecta a la transferencia tecnológica, el CENIA cuenta con más de 20 ingenieros dedicados a desarrollar proyectos para la industria y el Estado. En vinculación, el foco se centra en llevar a cabo iniciativas para fomentar en la sociedad el conocimiento de lo que realmente es la IA. Para ello se trabaja en actividades con escuelas, se realizan publicaciones y se participa en la elaboración del Índice Latinoamericano de Inteligencia Artificial (ILIA) conjuntamente con la Comisión Económica para América Latina y el Caribe (CEPAL). “Son distintos bienes públicos que aportamos para el desarrollo de la IA en Chile y en nuestra región”, enfatizó Soto, con relación a las actividades y las producciones de la entidad que dirige.

Pero lo que luego sería el CENIA se comenzó a gestar antes de su nacimiento, en 2017, durante el segundo mandato presidencial de Sebastián Piñera (2018-2022).En aquel momento el gobierno chileno empezó a trabajar en la Política Nacional de Inteligencia Artificial. Para ello, conformó un comité de expertos, del cual Soto fue miembro, y una de las conclusiones a las que arribó ese grupo de especialistas fue la necesidad de crear una institución especializada en IA. Eso dio lugar a un concurso para seleccionar una propuesta de constitución de dicho centro de donde surgió el CENIA, luego de que la idea sobre el mismo saliera ganadora de entre 28 iniciativas postuladas.

El CENIA cuenta con financiación estatal por cinco años, prorrogable por otros cinco, y con la posibilidad, asimismo, de captar recursos del sector privado. Su dotación es de cerca de 250 personas, entre las que se encuentran quienes trabajan a tiempo completo y los investigadores asociados. De todos ellos, el grupo más amplio es el de los estudiantes de doctorado cuyo número se acerca a los 70, luego están los investigadores con cerca de 40 personas y unos 25 ingenieros de desarrollo. En el caso de los investigadores, tres cuartas partes pertenecen a las universidades socias del CENIA, mientras que el resto son propios de la institución.

«Los modelos actuales no tienen un conocimiento de nuestra parte del mundo porque no han sido entrenados con datos de nuestra región”, dijo Soto.

LatamGPT

El Gran Modelo Abierto de Lenguaje Latinoamericano para Latinoamericanos (LatamGPT) es una iniciativa del CENIA para crear un Modelo de Lenguaje de Gran Tamaño (LLMs por sus siglas en inglés) que se constituya en la primera aplicación computacional de IA nativa de América Latina pensada para las demandas y necesidades de la región.

Hay dos metas puntuales detrás del esfuerzo que conlleva el LatamGPT. La primera es tratar de salvar las carencias que poseen los actuales modelos de IA que están a disposición con relación a la información y las realidades de espacios geoculturales como América Latina. Esas carencias provienen del hecho de que esos modelos de IA han sido desarrollados en otras partes del mundo, principalmente Estados Unidos y China, y su entrenamientose ha llevado a cabo con datos que en su amplia mayoría no provienen de Latinoamérica, ni están en idioma español. “Esto se refleja en que en distintos temas, cuando uno empieza a profundizar sobre tópicos relacionados con Latinoamérica, estos modelos típicamente comienzan a alucinar. Por ejemplo, si se hace el ejercicio de preguntarle a alguna de las plataformas más conocidas de IA quiénes son los autores de los libros en Chile te responde que casi todos son de Pablo Neruda, porque de alguna manera el modelo tiende a asociar a ese autor con todas las obras literarias chilenas”, ejemplificó Soto.

Las “alucinaciones” de los modelos de IA existentes, tal el término que se emplea técnicamente cuando estos sistemas brindan respuestas erráticas a las consultas que se les hacen por déficits en los datos que manejan o un error en su programación, pueden ir aún más allá. Tomando el caso de los libros chilenos y la autoría de Neruda, Soto explaya su explicación: “Además te cuentan la historia, te dicen, ‘mirá, Neruda escribió este libro cuando era joven’, lo que es falso, ni el libro es de él’”, en referencia a alguna obra literaria cualquiera no perteneciente al escritor de Isla Negra. “Eso da poca confiabilidad para usar esos modelos, por ejemplo, en nuestras salas de clase o en otro tipo de aplicaciones. Los modelos actuales no tienen un conocimiento de nuestra parte del mundo porque no han sido entrenados con datos de nuestra región”, dijo Soto.

La idea del LatamGPT es revertir esta situación. Para ello, el CENIA se propone “juntar fuerzas en toda la región para poder alimentar un modelo con conocimientos de nuestra política, nuestra economía, nuestra geografía, nuestro arte y distintos aspectos socioculturales de nuestra región de manera de que tengamos un especialista de IA en Latinoamérica”, señaló Soto.

Carrera mundial

La iniciativa chilena tiene antecedentes claros en otras partes del mundo. Francia lanzó en 2018 la Coordinación Nacional para la Inteligencia Artificial (COSNIA por sus siglas en francés), destinada a financiar y articular esfuerzos entre el sector público y el privado a fin de generar un modelo nativo galo. La India, a través del Instituto Nacional para la Transformación de la India (NITI Aayog por sus siglas en inglés), también en 2018 lanzó una Estrategia Nacional para la Inteligencia Artificial. En 2019, Rusia puso en marcha su “Estrategia Nacional para el Desarrollo de la Inteligencia Artificial hasta 2030”, recientemente actualizada, y tiene empresas líderes en diferentes rubros, tanto estatales como privadas, trabajando en el tema como Yandex, Sberbank, Rostec y Kaspersky. En 2021, Brasil puso en marcha la Estrategia Brasileña para la Inteligencia Artificial (EBIA), entre otros ejemplos.

“Hay una necesidad en términos de no ser un agente pasivo en esta revolución tecnológica, sino que uno sea un agente activo, en posición también de poder hacer un desarrollo directo de esta tecnología. Yo lo veo a esto [la competencia por la IA] como una carrera espacial, y en Latinoamérica podemos quedarnos afuera de esa carrera”, enfatizó Soto.

Oficinas del CENIA en Santiago de Chile (Foto: gentileza archivo CENIA).

Unirse y especializarse

El desarrollo de la IA ha estado asociada a la disponibilidad de ingentes cantidades de recursos, empezando por los económicos para montar y sostener la enorme y costosa infraestructura computacional sobre la que corre.Pero no sólo la plata es relevante en este tema.De igual manera, la disponibilidad de colosales volúmenes de datos para entrenar a los sistemas ha resultado crucial. Ambos insumos, el dinero y los datos, suelen ser casi imposibles de obtener en América Latina, al menos, en la escala que requiere un desarrollo de la IA acorde al estado del arte.

La cuestión del costo económico, así como la necesidad de una onerosa infraestructura física informática, está siendo fuertemente desafiada por el paradigma de desarrollo detrás de la IA china como DeepSeek, pero aún así, estamos hablando de logros realizados a partir de ecosistemas empresariales y tecnológicos completamente por encima de las escalas que se manejan en cualquier país latinoamericano.

“Quizás no vamos a competir con el super modelo que sabe todo de todo, pero, tal vez, podamos desarrollar modelos que sepan mucho de ciertos problemas, de salud o académicos, por ejemplo, que sean muy propios de nuestra región. Y, en ese caso, si bien las barreras de entradas son altas es factible tener logros”, resaltó Soto.

El entrenamiento de los programas de IA es una dimensión crucial y para ello se requieren grandes volúmenes de datos con los que estos sistemas van “aprendiendo”. El liderazgo de Estados Unidos y China en este campo no sólo está relacionado a los enormes recursos económicos con los que cuentan, o la gran cantidad de personas altamente formadas dedicadas al tema de las que disponen. De modo similar, está vinculado al hecho de contar con las mayores empresas procesadoras de bases de datos del mundo, lo que posibilita la generación de estos increíbles programas de IA. ¿Cómo se resuelve desde América Latina la ausencia de esos siderales volúmenes de datos para entrenar una IA? “Los datos los estamos haciendo en forma colaborativa –explicó Soto–. Unimos fuerzas con grupos de Colombia, Brasil, Argentina, México, Perú, Paraguay, Ecuador. Si cada uno aporta una cantidad importante de datos vamos a poder competir”.

Esta colaboración se está plasmando, por ejemplo, a través de la suscripción de acuerdo o convenios entre el CENIA, universidades e instituciones, públicas y privadas, vinculadas a la informática y la computación a lo largo y ancho de toda América Latina, como el celebrado en diciembre de 2024 con la Facultad de Matemática, Astronomía, Física y Computación (FAMAF) de la Universidad Nacional de Córdoba.

El manejo de grandes volúmenes de datos y el procesamiento de complejos algoritmos informáticos depende, asimismo, de la capacidad de cómputo con la que se cuente. Otro tópico en el cual los países latinoamericanos suelen estar bastante rezagados con respecto a los desarrollados. Chile está trabajando para achicar ese déficit y en tema de hardware computacional dedicado a IA, se está realizando una inversión de 10 millones de dólares estadounidenses (U$D) en equipamiento por parte de la Universidad de Tarapacá en el extremo norte de Chile.

En el seno del propio CENIA, el desarrollo del LatamGPT implica el trabajo de varios grupos especializados que interactúan entre ellos. Por ejemplo, uno se dedica a la parte de las bases de datos, otro a la implementación del programa para que pueda ejecutarse en forma distribuida en diferentes centros de cómputos de alto rendimiento, otro al alineamiento del software (su “instrucción” para que pueda interactuar con los usuarios) y otro se enfoca en la evaluación. Este último aspecto reviste especial importancia teniendo en cuenta que se pretende obtener una IA que sea superior a cualquier otra en temas latinoamericanos. Con esta meta en vista, y como parte de la evaluación de la iniciativa, se está haciendo un trabajo de comparación (benchmark) para demostrar que LatamGPT verdaderamente es el sistema IA que más conoce de América Latina y sus cuestiones.

El primer gran objetivo del CENIA es tener listo para mediados de 2025 un modelo piloto de lenguaje grande latinoamericano con cerca de 70 millones de parámetros, algo que sería muy respetable en cuanto a escala de procesamiento, considerando que actualmente ChatGPT, por citar este emblemático caso, dispone de aproximadamente 175 millones de parámetros.

En el pasado, América Latina ha quedado rezagada en casi todas las revoluciones tecnológicas acaecidas desde fines del siglo XIX hasta la actualidad, con algunas excepciones muy puntuales como puede ser la industria nuclear en Argentina o la aeronáutica en Brasil. Es imperioso que en lo atinente a la IA también construya otra excepción. El CENIA surge como un esperanzador protagonista de este nuevo tablero del desarrollo internacional.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *