La brecha de la diversidad lingüística en la IA: un reto mundial y una oportunidad perdida
La inteligencia artificial (IA) está reconfigurando industrias, economías y sociedades, pero persiste un problema flagrante: la falta de diversidad lingüística en los sistemas de IA. Aunque las capacidades lingüísticas de la IA se están convirtiendo en parte integrante de sectores que van desde la sanidad a la educación, la mayoría de los sistemas solo están entrenados en una fracción de las lenguas del mundo. De las más de 7.000 lenguas que se hablan en el mundo, menos de 100 están representadas en los datos utilizados para entrenar los modelos de IA. Esta estrechez de miras corre el riesgo de dejar atrás a miles de millones de personas, limitando su capacidad para participar plenamente en la economía digital y beneficiarse de los avances de la IA.
La creciente brecha: Una barrera lingüística en la IA
A pesar de la rápida proliferación de las tecnologías de IA, la representación lingüística sigue siendo alarmantemente sesgada. De las 34 lenguas más utilizadas en Internet, ninguna es africana, lo que subraya la exclusión de continentes enteros de la revolución de la IA. El inglés sigue siendo el idioma dominante en los modelos de entrenamiento de IA, a pesar de que menos del 20% de la población mundial lo habla. Esta ventaja de las "lenguas de altos recursos" contrasta fuertemente con las muchas lenguas de "bajos recursos" que tienen poca o ninguna representación en las bases de datos de IA.
A medida que la IA se integra cada vez más en los sistemas globales, la exclusión de las lenguas con pocos recursos amenaza con ampliar las brechas socioeconómicas existentes. "Es a la vez un reto y una de las mayores oportunidades", afirma Crystal Rugege, Directora Gerente del Centro para la Cuarta Revolución Industrial de Ruanda, que destaca el potencial sin explotar de la IA lingüísticamente diversa. "Puede que no tengamos aplicaciones que puedan interactuar en 1.400 dialectos, pero deberíamos ser capaces de servir a la mayoría de nuestras poblaciones".
Las consecuencias de la exclusión
Si se mantienen las tendencias actuales, amplios sectores de la población mundial podrían quedar excluidos de la participación en la economía digital. Los sistemas de IA no son sólo herramientas técnicas, sino puertas de acceso a recursos, oportunidades y crecimiento económico. Para las comunidades que ya luchan con un acceso inadecuado a Internet y una infraestructura digital limitada, la falta de diversidad lingüística en la IA exacerba los retos existentes, creando una brecha aún mayor entre las comunidades lingüísticas de altos y bajos recursos.
Cathy Li, responsable de IA, Datos y Metaverso del Foro Económico Mundial, advierte de que los ya desfavorecidos "probablemente se quedarán aún más atrás". Los modelos de IA que se adaptan predominantemente al inglés y a otros pocos idiomas ampliamente hablados están perdiendo la oportunidad de empoderar a la gran mayoría de las poblaciones mundiales, especialmente a las que viven en regiones rurales o de bajos ingresos.
El potencial de la IA para la inclusión: Primeras iniciativas mundiales
A pesar de las dificultades, están surgiendo iniciativas para abordar la brecha lingüística de la IA. Desde la India hasta Ruanda, los países están experimentando con sistemas de IA que se adaptan a un conjunto más diverso de lenguas. En Ruanda, las aplicaciones de IA lingüísticamente diversas están ayudando a los trabajadores sanitarios de la comunidad, que hablan principalmente las lenguas locales, a proporcionar cuidados críticos en zonas remotas. Rugege destaca un modelo de traducción que permite a los trabajadores comunicarse con la IA en varios idiomas, garantizando que los pacientes reciban una atención adecuada incluso en comunidades donde no se habla inglés.
Del mismo modo, en Senegal se están desarrollando plataformas sanitarias basadas en IA para dar cabida a las lenguas oficiales del país, como el wolof, el francés y otras. Como señala Yann LeCun, científico jefe de IA de Meta, estas iniciativas demuestran el potencial de la IA para salvar las diferencias lingüísticas y prestar servicios esenciales en zonas desatendidas.
El papel de la IA de código abierto y las asociaciones mundiales
Una de las soluciones más prometedoras a la brecha de la diversidad lingüística reside en los modelos de IA de código abierto. Estas plataformas ofrecen a las comunidades la oportunidad de desarrollar sistemas de IA adaptados a sus propias lenguas y contextos culturales. LeCun imagina una infraestructura de IA abierta, comparándola con la "Wikipedia de la IA", en la que los desarrolladores locales puedan crear sistemas que respondan a las necesidades específicas de sus poblaciones.
Las asociaciones también son fundamentales para impulsar la diversidad lingüística en la IA. Por ejemplo, la colaboración de Meta con el gobierno indio pretende desarrollar modelos de IA capaces de comprender las 22 lenguas oficiales de la India, con potencial para ampliarse a cientos de dialectos. Estas iniciativas ponen de relieve la importancia de la cooperación intersectorial para superar los problemas técnicos y de datos que han limitado hasta ahora la inclusión lingüística de la IA.
Hacia un futuro con una IA más diversa
El futuro de la IA debe ser integrador y lingüísticamente diverso para que beneficie realmente a toda la humanidad. Los líderes de las Reuniones de Impacto sobre el Desarrollo Sostenible del Foro Económico Mundial celebradas en Nueva York hicieron hincapié en que la IA debe servir para todo el espectro de lenguas globales, reflejando la rica diversidad lingüística y cultural del mundo.
Investigadores de IA como Pascale Fung sostienen que crear sistemas capaces de salvar la distancia entre las lenguas de altos y bajos recursos no es sólo un objetivo técnico, sino un imperativo social. Fung aboga por recopilar más datos lingüísticos para afinar los modelos de grandes lenguas (LLM) de modo que puedan rendir al mismo nivel que los modelos basados en el inglés.
El camino por recorrer: Retos y oportunidades
Abordar la brecha de la diversidad lingüística en la IA es una tarea ingente, pero también presenta una oportunidad transformadora. Gobiernos, empresas tecnológicas e investigadores deben colaborar para garantizar que los sistemas de IA sirvan como herramientas de inclusión y no de exclusión. Iniciativas como la Alianza para las Tecnologías Lingüísticas (ALT-EDIC) de la Comisión Europea y el desarrollo por parte de los EAU de grandes modelos lingüísticos como NANDA, diseñado para usuarios de habla hindi, demuestran que es posible avanzar.
La IA tiene el potencial de revolucionar sectores que van desde la sanidad a la educación, pero solo si es accesible para todos. La brecha lingüística en la IA debe considerarse no solo una barrera, sino una oportunidad para remodelar el panorama digital de forma más inclusiva, equitativa e innovadora.
Como subrayó Yann LeCun, de Meta: "Necesitamos una gran diversidad de sistemas de IA para atender a todos nuestros diversos intereses, normas culturales, sistemas de valores e idiomas". Sin esfuerzos concertados para incluir las lenguas de bajos recursos, la revolución de la IA corre el riesgo de dejar atrás a miles de millones de personas. El futuro de la IA debe ser tan diverso como el mundo al que pretende servir.