La IA ayuda a pulsar el influjo del español en Internet

La RAE y AWS han diseñado una herramienta capaz de analizar decenas de miles de documentos a la vez.

Publicado el 27 May 2022

57113_88

La Real Academia Española (RAE) y Amazon Web Services (AWS) han presentado la herramienta de análisis del español que han creado conjuntamente. Permite examinar, en muy poco tiempo y mediante sistemas de inteligencia artificial, decenas de miles de documentos de Internet a la vez con el fin de valorar el estado del español en el mundo.

Este sistema, desarrollado a partir de las tecnologías nativas de la nube de AWS y con el asesoramiento de la RAE, servirá como barómetro de distintos parámetros y será la base para la recopilación de datos masivos.

La presentación se ha llevado a cabo en la sede de la Academia y ha contado con las intervenciones del director de la RAE y presidente de la ASALE, Santiago Muñoz Machado; el director general de Amazon Web Services en España y Portugal, Miguel Álava, y el director de Tecnología de AWS en Iberia, Carlos Carús.

El acto, cuya bienvenida ha estado a cargo del director de la RAE, ha sido clausurado por la secretaria de Estado de Digitalización e Inteligencia Artificial, Carme Artigas.

La herramienta RAE-AWS

En su primera versión beta, la herramienta contiene 8.745.563 documentos de España y todos los países hispanohablantes de América. Por el momento, sus fuentes se centran en el español digital espontáneo actual, especialmente el propio de textos informales obtenidos de redes sociales, foros o plataformas de venta en línea, pero también se ha incluido una representación de textos periodísticos para poder observar las diferencias entre un tipo de lenguaje y otro. Actualmente, está dividida en tres grandes bloques que incluyen el estudio de extranjerismos, detectando su proporción en los textos; el análisis de la riqueza léxica, midiendo la diversidad de palabras a través del sistema MTLD (del inglés measure of textual lexical diversity ‘medida de la diversidad léxica textual’), y un radar de errores lingüísticos que los identifica y clasifica como ortográficos, gramaticales, léxicos, de estilo y tipográficos. Se han integrado reglas extraídas de obras normativas de la RAE.

El desarrollo de esta herramienta permitirá, entre otras acciones futuras, el análisis de la claridad del lenguaje administrativo, la comparación de calidad del español por épocas o la detección de errores comunes en asistentes de voz y otros dispositivos de IA.

La colaboración entre la RAE y AWS se enmarca en el proyecto Lengua Española e Inteligencia Artificial (LEIA). La acción busca aplicar la IA a nuestro idioma para hacer un análisis de su situación actual, cuidar su uso y velar por la unidad de nuestra lengua en todos los ámbitos, especialmente en el digital.

¿Qué te ha parecido este artículo?

La tua opinione è importante per noi!

C
Redacción Computing

Artículos relacionados

Artículo 1 de 2