Lingüista advierte sobre los riesgos de la IA para los diccionarios y el español

Especialista alerta sobre los peligros de la inteligencia artificial para los diccionarios y la lengua española

En un momento histórico donde los modelos de lenguaje de inteligencia artificial comienzan a predominar en la comunicación digital, el diccionario debe seguir siendo la columna vertebral de la información lingüística sobre las palabras, afirmó el catedrático Cecilio Garriga, director del Grupo de Lexicografía y Diacronía de la Universidad Autónoma de Barcelona.

Durante la conferencia "Los diccionarios y la inteligencia artificial", coordinada por el lingüista Luis Fernando Lara, miembro de El Colegio Nacional, Garriga expuso cómo este instrumento simbólico que tradicionalmente identificamos con el prestigio lingüístico ha evolucionado desde formato físico hasta digital, enfrentando ahora una nueva amenaza tecnológica.

La fascinante mentira de los modelos de lenguaje

El investigador demostró mediante un experimento con ChatGPT los riesgos fundamentales de sustituir el lexicón tradicional por respuestas generadas por inteligencia artificial. Al consultar por la palabra inventada "xenodolia" -inexistente tanto en el Diccionario de la lengua española como en el Diccionario del español de México- el chatbot proporcionó:

—

Banner ancho de Pickt — app de listas de compras colaborativas para Telegram

Una definición completa sobre hospitalidad hacia extranjeros
Origen griego supuesto con referencias mitológicas detalladas
Argumentación cultural sobre prácticas sociales en la antigua Grecia

"Toda esta argumentación que parece tan verosímil es absolutamente inventada", señaló Garriga. "Los diccionarios, si les preguntamos por una palabra, nunca van a inventar una respuesta. Se anclan en testimonios reales, mientras que la inteligencia artificial puede mezclar verdad y verosimilitud sin distinguirlas".

Empobrecimiento cultural y nueva colonización lingüística

El especialista identificó problemas adicionales en la implementación masiva de estos sistemas:

Empobrecimiento cultural: Los llamados modelos generativos en realidad se aprovechan de contenidos creados por otros sin citar fuentes, afectando la propiedad intelectual y la sostenibilidad de medios tradicionales.
Colonización anglosajona: La mayoría del contenido utilizado para entrenar estos sistemas está en inglés, imponiendo una visión del mundo desde esa perspectiva cultural y lingüística.
Dilución de variaciones regionales: En español, responden con menos variación léxica que un hablante nativo y cometen errores en lenguas altamente flexivas.
Exclusión de lenguas minoritarias: Para lenguas indígenas o con menos hablantes, simplemente no responden por falta de datos de entrenamiento.

"Podemos hablar incluso de una nueva colonización lingüística a través de la inteligencia artificial, y no solo lingüística sino cultural", alertó el catedrático, destacando cómo la lengua conlleva referencias culturales específicas que se pierden en estos modelos.

Propuestas para un futuro lingüístico equilibrado

Frente a este panorama, Garriga propuso acciones concretas en múltiples niveles:

Regulación institucional: Tratar la inteligencia artificial como infraestructura crítica, similar a telecomunicaciones o energía, exigiendo transparencia a las empresas desarrolladoras.
Desarrollo tecnológico alternativo: Apoyar modelos públicos no comerciales y crear corpus locales abiertos y robustos para entrenar sistemas en diversas variedades del español y otras lenguas.
Defensa del patrimonio lingüístico: Proteger los diccionarios nacionales como depositarios del patrimonio lingüístico comunitario.
Educación crítica: Concienciar desde los primeros niveles educativos para diferenciar texto verosímil de texto verdadero, fomentando un uso responsable de estas tecnologías.

La conferencia completa "Los diccionarios y la inteligencia artificial" se encuentra disponible en el canal oficial de El Colegio Nacional, destacando la urgente necesidad de equilibrar innovación tecnológica con preservación lingüística en la era digital.