Latam GPT

Latam GPT y el aporte dominicano

Mientras los grandes modelos de inteligencia artificial siguen concentrando su entrenamiento en contenidos de Estados Unidos, Europa y Asia, América Latina empieza a construir su propia infraestructura lingüística.

En ese contexto surge Latam GPT, un modelo de lenguaje de gran escala desarrollado desde la región con el objetivo de corregir un desbalance evidente: los sistemas globales de IA apenas contienen entre dos y tres por ciento de información contextual sobre América Latina. El resultado es una brecha cultural que se refleja cada vez que estos modelos intentan responder preguntas sobre historia, geografía o identidad latinoamericana.

El modelo fue presentado oficialmente en febrero de 2026 en los estudios de TVN en Santiago de Chile, durante un evento que reunió a instituciones académicas, tecnológicas y organismos multilaterales vinculados al proyecto. Latam GPT fue desarrollado por el Centro Nacional de Inteligencia Artificial de Chile (CENIA) junto a más de 65 instituciones de la región. Se trata de un modelo abierto con 70 mil millones de parámetros, entrenado sobre un corpus de aproximadamente 300 mil millones de tokens de contenido latinoamericano. La intención es clara: construir una base de conocimiento regional que permita respuestas más precisas cuando se trate de temas propios de nuestros países.

En ese proceso, República Dominicana terminó ocupando el primer lugar en el benchmark cultural del proyecto, con una puntuación de 16.2 por ciento, superando a países como Ecuador, Colombia, México, Perú y Chile entre los trece participantes de la iniciativa. Este indicador mide la capacidad del modelo para responder correctamente preguntas relacionadas con identidad cultural, historia, geografía y referencias sociales de cada país.

La participación dominicana en el proyecto se articuló a partir de 2025 a través de Tabuga, empresa de consultoría tecnológica con sede en Santo Domingo que formalizó una alianza estratégica con CENIA para representar sus servicios de inteligencia artificial en el país y en el Caribe. A partir de ese acuerdo se inició un proceso de colaboración orientado tanto a la adaptación de soluciones de IA al contexto local como a la incorporación de contenido dominicano en el entrenamiento del modelo.

Uno de los hitos dentro de ese proceso fue la integración de CDN Canal 37 en julio de 2025 como proveedor de contenido informativo y cultural. Esto permitió incorporar material noticioso y referencias nacionales dentro del corpus de entrenamiento, marcando uno de los primeros casos en los que una empresa privada dominicana contribuye con datos para el desarrollo de un modelo de lenguaje de alcance regional.

El resultado en el benchmark cultural está asociado precisamente a esa incorporación sistemática de contenidos dominicanos. Entre las fuentes utilizadas para construir conjuntos de preguntas y respuestas aparecen varias publicaciones editadas por el Banco Popular Dominicano, incluyendo estudios históricos, obras sobre patrimonio cultural y análisis sobre el desarrollo económico del país. A partir de estos materiales se elaboraron entradas de conocimiento que abarcan desde procesos históricos y transformaciones sociales hasta patrimonio natural y turismo.

La lógica detrás de Latam GPT responde a un problema que los propios investigadores del CENIA han documentado al evaluar modelos globales como GPT, Mistral, DeepSeek o Gemma. Cuando se comparan preguntas sobre entidades latinoamericanas con preguntas sobre entidades de otras regiones, los modelos muestran una diferencia clara en su capacidad de respuesta: saben considerablemente menos sobre América Latina.

El objetivo del proyecto es reducir esa brecha mediante un entrenamiento más balanceado, donde la diversidad cultural, lingüística y temática de la región tenga un peso proporcional dentro del modelo. La iniciativa también busca establecer un precedente en materia de transparencia, ya que el sistema se distribuirá de forma abierta junto con los códigos de entrenamiento, los protocolos de gobernanza de datos y los benchmarks utilizados para su evaluación.

Más allá del resultado puntual en el ranking cultural, el caso dominicano refleja algo más relevante: la transición gradual de la región desde el consumo de tecnología hacia una participación más activa en su desarrollo. En el caso de la inteligencia artificial, esto implica algo más que adoptar herramientas externas. Supone contribuir con datos, conocimiento y contexto cultural para que las tecnologías que utilizamos también entiendan mejor quiénes somos.

Deja una respuesta

AUTORA

ROCIO DIAZ

ARTICULOS RECIENTES

Categorías

instagram