EMOLTV

¿Qué es LatamGPT?: Proyecto liderado por Chile que desarrolló la primera IA de Latinoamérica

La plataforma fue pensada para fortalecer el ecosistema de innovación de la región y apoyar la ejecución de soluciones tecnológicas con identidad propia.

10 de Febrero de 2026 | 17:36 | Redactado por Vladimir Núñez, Emol
Chile busca estar a la vanguardia del desarrollo tecnológico en América Latina con la creación de LatamGPT, la primera Inteligencia Artificial (IA) de la región, que corresponde a un proyecto innovador que busca promover la identidad y cultura de Latinoamérica en el campo de la IA.

El ambicioso proyecto fue liderado por Chile, a través del Centro Nacional de Inteligencia Artificial (CENIA), en colaboración con una veintena de organizaciones pertenecientes a diversos países latinoamericanos, con el objetivo de aprovechar el potencial de la región y entregarle representatividad en medio del escenario actual de la inteligencia artificial a nivel global.

    ¿Qué es LatamGPT?

  • LatamGPT es un chatbot basado en un modelo de lenguaje latinoamericano y desarrollado de manera colaborativa.
  • Su desarrollo estuvo liderado por el Centro Nacional de Inteligencia Artificial (CENIA) con el apoyo del Ministerio de Ciencia, el Banco de Desarrollo de América Latina y el Caribe (CAF), Amazon Web Services (AWS) y el centro tecnológico Data Observatory.
  • Además, la plataforma fue impulsada en conjunto con más de 20 instituciones de América Latina y más de 60 expertos y expertas en Inteligencia Artificial (IA).
  • Su lanzamiento contó con la presencia del Presidente de la República, Gabriel Boric, junto a destacadas autoridades nacionales y regionales, miembros del cuerpo diplomático y diversos representantes del ecosistema tecnológico latinoamericano.
  • A diferencia de los modelos de lenguaje actuales de IA, generados principalmente en el norte global, LatamGPT fue concebido como un bien público orientado a democratizar el acceso a esta tecnología y habilitar su uso en ámbitos estratégicos como educación, gestión pública e innovación productiva.
  • Representación de joven utilizando IA en un computador. | Freepik
  • Lo anterior, gracias a su diseño de código abierto, que permitiría a universidades, gobiernos, startups y diversas comunidades, desarrollar soluciones propias sobre una base común, transparente y trazable.
  • ¿Cómo influyen los idiomas y datos locales en la plataforma?

  • La construcción de LatamGPT responde a una brecha histórica en el desarrollo de modelos de lenguaje a nivel global, ya que, según estimaciones basadas en repositorios abiertos como Common Crawl, los datos en español y portugués representan, respectivamente, apenas cerca del 4% y el 2% del total utilizado para entrenar este tipo de sistemas.
  • Trabajadores de CENIA exponiendo sobre IA en el Congreso Futuro. | Cenia en X (@cen_ia)
  • Esta subrepresentación implicó que las realidades latinoamericanas no fueran consideradas de manera adecuada ni en el diseño ni en el entrenamiento inicial de gran parte de los modelos disponibles hoy, quedando incorporadas, en muchos casos, a través de ajustes posteriores y mecanismos de corrección, y no como parte constitutiva de su arquitectura.
  • Frente a este escenario, LatamGPT fue entrenado desde su origen para comprender las variantes del español y el portugués, así como las historias, memorias e identidades culturales de la región.
  • Esto permitió procesar, generar y analizar idiomas de manera situada y contextualizada, con potencial aplicación en investigación, gestión pública y desarrollo tecnológico.
  • ¿Cómo fue desarrollada?

  • Para llegar a la creación de un modelo 1.0 de LatamGPT, el proceso consideró la recolección y curaduría de datos, además de un periodo de pre-training y post-training.
  • Cabe mencionar que el modelo se desarrolló sobre una arquitectura base Llama 3.1 (70 mil millones de parámetros, complementada con un corpus regional) un conjunto organizado de textos y contenidos con los que se entrena un modelo de lenguaje y que le permite comprender el contexto cultural e identitario de la región, obtenido bajo permisos.
  • Logotipo de LatamGPT. | Cenia
  • Ello, además de benchmarks adaptados al contexto latinoamericano y una documentación rigurosa en materia ética y de gobernanza.
  • La construcción de LatamGPT fue posible gracias a una colaboración inédita entre instituciones públicas, académicas y tecnológicas de la región, articulando a más de 100 profesionales y más de 60 instituciones de 15 países, que aportaron datos, conocimiento y experiencia técnica.
  • En este esfuerzo regional, el CENIA y el Ministerio de Ciencia, desempeñaron un rol clave al coordinar puntos focales en los países participantes, lo que permitió canalizar la búsqueda, selección y aporte de datasets representativos de la región.
  • En total, se reunieron más de 300 mil millones de tokens de texto plano, equivalentes a alrededor de 230 mil millones de palabras, obtenidos bajo permisos y licencias explícitas, curados de tal manera de asegurar la anonimización de datos y eliminar elementos tóxicos (como noticias falsas o discriminación, por ejemplo).
  • Gracias a ese proceso, el modelo cuenta con un dataset de alta calidad en áreas como humanidades y ciencias sociales, educación, ciencias de la salud, políticas públicas, economía, medioambiente, artes y pueblos indígenas.
EL COMENTARISTA OPINA
¿Cómo puedo ser parte del Comentarista Opina?