En medio de la Cumbre para la Acción sobre la IA (inteligencia artificial) que se desarrolló este lunes y martes en París, la ministra de Ciencia, Tecnología, Conocimiento e Innovación (CTCI), Aisén Etcheverry, y el gerente general del Centro Nacional de Inteligencia Artificial (Cenia), Rodrigo Durán, revelaron a DF lo impensado: Chile está desarrollando su propio modelo de lenguaje grande (LLM, en inglés) de inteligencia artificial, se llama Latam GPT, será público, abierto e inclusivo y se lanzará en junio de 2025.
En esta oportunidad, el país llega con una respuesta a un problema global, que es parte de las discusiones de la Cumbre de IA de París, que es la necesidad de contar con modelos de IA entrenados con datos de cada país o región, donde aspectos como la cultura, la historia, las regulaciones o la diversidad étnica, se vean representados en esos sistemas.
US$ 550 mil Estima el cenia la inversión inicial en el LLM chileno.
Detrás de esta iniciativa nacional, está el ministerio de CTCI como mandante y el Cenia como ejecutor. La ministra Etcheverry, explicó que desarrollar un LLM propio es estratégico en muchos ámbitos y destacó que refuerza y proyecta el liderazgo del país en inteligencia artificial, es coherente con la estrategia nacional en esta materia y favorece la resiliencia tecnológica, la que también considera “nueva infraestructura de IA, conectividad con distintos lugares del mundo, generar capacidades locales de investigación y usos en el Estado”.
Etcheverry comentó también que la bandera con la cual Chile se presenta en los foros internacionales es la del uso responsable y ético de la IA, pero también el de la equidad. “Todos los países deben tener la posibilidad de poder desarrollarla, de poder implementarla en sus gobiernos, en sus industrias y para eso las capacidades no pueden estar centradas en unas pocas empresas o países, sino que todos tienen que tener capacidades suficientes para poder hacer desarrollos propios”.
Un modelo para la región
Detrás del desarrollo de Latam GPT está el Cenia, que integran varias universidades y que se financia con 30% de recursos públicos e ingresos por el desarrollo de soluciones para terceros y cursos de formación.
Durán explicó que el centro de IA, que se creó en 2020, tenía en su propuesta fundacional el desarrollo de un LLM. Formaron un equipo interno liderado por el presidente del Cenia, Álvaro Soto y no fue hasta 2023 que pusieron en marcha la iniciativa de carácter regional.
“El gran norte del proyecto es desarrollar capacidades en Chile y en los países de la región. Por una parte, queremos mostrar que Chile -y América Latina- es capaz de desarrollar un modelo de lenguaje público, porque hay privados como Wide Labs en Brasil o el de Globant en Argentina, pero son modelos cerrados y queremos que el nuestro esté disponible para los países de Latinoamérica, y por otro lado, generar estas capacidades”, afirmó Durán.
El ejecutivo explicó que Latam GPT es un LLM abierto, con 55 billones de parámetros, con tres trillones de datos tokenizados, “equivalente al Chat GPT 3.5 en volumen” y cuya licencia permitirá el desarrollo de aplicativos sobre él.
Se trata de un LLM entrenado con datos de los países de la región, porque “el espíritu de la construcción del modelo es que sea el mejor modelo para problemas de América Latina y el Caribe”, dijo Durán.
En dos años el Cenia ha invertido unos US$ 550 mil en el desarrollo, US$ 300 mil propios y US$ 250 mil aportados por la Corporación Andina de Fomento (CAF).
Además, la Universidad de Tarapacá invirtió US$ 5 millones en un supercomputador con GPU -una infraestructura que hasta ahora no había en Chile- lo que les permitió acelerar el proceso.
El equipo del Cenia está trabajando con 60 profesionales en toda América Latina que están en roles de alineamiento, abastecimiento de datos, preentrenamiento, de definición de benchmarks y otros que están en roles de datos. También colaboran 27 instituciones de inteligencia artificial de la región, incluidas universidades de Argentina, Colombia, México y Uruguay.
“La red que hemos construido y que está invirtiendo recursos humanos para entender y desentrañar lo que significa desarrollar un modelo de lenguaje es algo que desde nuestro punto de vista es lo más valioso de este proyecto, mucho más que los aplicativos en el corto plazo”, afirmó Durán.
Potencial
La ministra Etcheverry estimó que Latam GPT puede tener un impacto muy positivo en la transformación digital del Estado, “porque va a poder descansar en un modelo de lenguaje que corre en infraestructura que está en Chile, que está entrenado con lenguaje, sintaxis e idiosincrasia chilena” y que, por lo tanto, es mucho más apropiado para hacer cualquier tipo de desarrollo en IA, en cualquier institución del Estado.
“Queremos involucrar a distintos organismos públicos y municipios para poder desarrollar aplicaciones con el modelo que sean de utilización ciudadana”, dijo.
Y en el caso del sector privado, señaló que puede tener un potencial grande para las startups y adelantó que el tema es parte de la hoja de ruta de IA del Ministerio de Ciencia con los gremios empresariales.
También destacó la convocatoria que abrió la Corfo para instalar nuevos centros de datos para diversificar los tipos de infraestructura para cómputo que hoy tiene el país.
“En la lógica de la resiliencia no nos basta con los data centers comerciales, sino que necesitamos infraestructura para investigación, startups locales en IA, en modelos tradicionales de cómputo”, dijo la ministra.