Redacción Voz de la Diáspora
El Salvador- La Agencia Nacional de Inteligencia Artificial (ANIA) lanzó el primer dataset soberano del país, una herramienta que permitirá desarrollar sistemas de IA adaptados a la realidad salvadoreña sin utilizar datos personales de la población.
Hoy, trabajando con NVIDIA y WideLabs, líder latinoamericano en IA soberana, tenemos Nemotron-Personas-El-Salvador. Es el primer conjunto de datos abierto de personas sintéticas construido específicamente para El Salvador y fundamentado en nuestras propias estadísticas oficiales, informaron las autoridades de ANIA, en redes sociales.

Este es un hito para El Salvador en el ecosistema de IA
Ahora se tiene una base soberana para desarrollar inteligencia artificial, del mismo tipo que las principales economías tecnológicas como Estados Unidos, Singapur, Japón, India, Brasil, Francia y Corea también están construyendo a través del programa global Nemotron-Personas de NVIDIA.
Gerson Martínez, un experto en Tecnología, explica en su cuenta de X que, la mayoría de los sistemas de IA se entrenan con datos de internet estadounidenses. La capa de aplicaciones utilizada en todo el mundo refleja en gran medida cómo hablan, trabajan, compran, interactúan entre sí, navegan por la vida diaria, etc., los estadounidenses.
A través de esta asociación con NVIDIA, El Salvador creará ciudadanos digitales sintéticos con perfiles que representan a personas de El Salvador, permitiendo a los desarrolladores entrenar y probar herramientas de IA que reflejen las tendencias y comportamientos salvadoreños sin exponer los datos privados de personas reales. En resumen, los desarrolladores, empresas y agencias gubernamentales salvadoreñas tendrán mejores materiales crudos para construir herramientas de IA que realmente funcionen en un contexto salvadoreño.
«Lo repito: no subestimen a El Salvador. Esto es lo que parece un Primer Giro.» advierte Gerson Martínez.
Por qué importa: el cambio hacia agentes de IA
La IA está pasando de chatbots simples a agentes que realizan tareas de varios pasos para las personas, y eso eleva el estándar en cuanto a confiabilidad, consistencia y adecuación cultural. No se puede lograrlo con datos traducidos de otros mercados o escritos en un español genérico de algún otro lugar.
Por eso Nemotron-Personas-El-Salvador importa. Es un conjunto de datos abierto de personas sintéticas —perfiles ficticios pero realistas que reflejan nuestras demografías reales— para que los equipos puedan construir y probar estos agentes sin usar datos personales reales de nadie.
Es gratuito bajo una licencia CC BY 4.0, por lo que desarrolladores, universidades y startups pueden construir sobre una base compartida.

Construido para El Salvador, con los socios adecuados
Nemotron-Personas-El-Salvador no fue traducido de otro mercado. Fue construido para El Salvador desde cero. Incorporaron a los socios adecuados —NVIDIA y WideLabs, un líder latinoamericano en IA soberana— para desarrollarlo en torno a nuestros propios datos y prioridades, fundamentado en fuentes oficiales salvadoreñas, asegura en su publicación la Agencia Nacional de la IA en El Salvador.
Como lo expresó Lídice Nahomi González Aguilar, directora ejecutiva Adjunta de la Agencia Nacional de IA de El Salvador (ANIA):
“A través de este trabajo con WideLabs y NVIDIA, estamos trayendo tecnología de vanguardia al país: conjuntos de datos sintéticos que nos proporcionan una base de privacidad por diseño para desarrollar sistemas de IA genuinamente adaptados al contexto salvadoreño.”

Lo que El Salvador obtiene de esto
Nemotron-Personas-El-Salvador está abierto y en vivo en Hugging Face hoy
Nemotron-Personas-El-Salvador es un conjunto de datos de código abierto (CC BY 4.0) compuesto por personas generadas sintéticamente. Este conjunto de datos está anclado en las distribuciones demográficas, geográficas y de rasgos de personalidad reales de El Salvador para capturar la diversidad y la riqueza de la población salvadoreña. Es miembro de la colección Nemotron Personas y el primer conjunto de datos salvadoreño de este tipo alineado con estadísticas de nombres, sexo, edad, estado civil, educación, ocupación y ubicación, entre otros atributos.
Aquí está lo que nos da:
1.Servicios ciudadanos: cobertura demográfica a escala poblacional en todos los 14 departamentos, con alrededor de 1M de personas sintéticas para construir y evaluar asistentes de IA para el público salvadoreño.
2.Privacidad por diseño: todos los datos son completamente sintéticos, sin información personal identificable. Está fundamentado en las distribuciones reales del censo de 2024 de El Salvador, pero cada persona es generada artificialmente, y no se representan individuos reales, lo que lo hace seguro, ético y listo para usar de inmediato.
3.Una posición más fuerte: El Salvador se sitúa junto a las principales economías tecnológicas en la colección Nemotron-Personas de NVIDIA, con una base abierta sobre la que todo nuestro ecosistema puede construir.
Es gratuito para el gobierno, universidades, startups e investigadores.
El Salvador se ha colocado a la vanguardia de la IA soberana en la región, y esta es el tipo de base que se acumula: cada asistente, agente y modelo construido sobre ella hace que el siguiente sea mejor. Un nuevo El Salvador está tomando forma: no solo un lugar que adopta tecnología de vanguardia, sino uno donde la gente la construye.