La empresa matriz de Facebook, Meta, ha desarrollado un modelo de IA que puede traducir 200 idiomas diferentes.

Meta afirma que su modelo de procesamiento del lenguaje natural (PLN) es el primero capaz de traducir en tantos idiomas, con especial atención a las lenguas africanas.

A handful of languages dominate the internet, which means only a fraction of the world can access content and contribute to the web in their own language. But machine translation models require lots of data for training, making it difficult to develop tools for languages that have fewer written examples online.

El consejero delegado de Meta, Mark Zuckerberg, dijo que el nuevo modelo de PNL de la empresa permitirá «25.000 millones de traducciones diarias» en las aplicaciones de la compañía.

Llamamos a este proyecto «No Language Left Behind», y las técnicas de modelización de la IA que utilizamos están ayudando a realizar traducciones de alta calidad para idiomas hablados por miles de millones de personas en todo el mundo», añadió.

Zuckerberg dijo que el modelo de IA, llamado NLLB-200, tiene más de 50.000 millones de parámetros y fue entrenado en el superordenador de IA de la empresa llamado Research SuperCluster.

Meta compartió por primera vez los detalles del proyecto No Language Left Behind en febrero, cuando la empresa presentó su enfoque de investigación en IA para el año que viene. También se incluyen los ambiciosos planes de un Traductor Universal del Habla para mejorar el apoyo a las lenguas que carecen de un sistema de escritura estandarizado.

Meta dijo que el nuevo modelo NLLB-200 puede traducir 55 lenguas africanas, incluidas muchas de bajo recurso que tienen pocos ejemplos escritos disponibles en línea y no suelen ser compatibles con las herramientas de traducción automática.

El gigante tecnológico dijo que ha trabajado con traductores profesionales de cada idioma para poder desarrollar un punto de referencia fiable y evaluar automáticamente la calidad de la traducción de los idiomas con pocos recursos.

Meta ha publicado un documento de investigación sobre el modelo de IA y dijo que proporcionará herramientas para que otros investigadores amplíen el trabajo a otros idiomas.

Su modelo es de código abierto y las lecciones del proyecto se están aplicando a los sistemas de traducción utilizados por los editores de Wikipedia.

Modelos «poco manejables

Victor Botev, director de tecnología de la empresa de investigación de IA Iris.ai, dijo que la destreza de ingeniería necesaria para presentar suficientes datos para estos conjuntos de datos oscuros es una «maravilla».

Sin embargo, advirtió que este tipo de modelos de IA no son necesariamente la «panacea» que pueden parecer, ya que pueden tener problemas con tareas específicas debido a su tamaño.

«Los modelos que utiliza Meta son bestias enormes y difíciles de manejar», dijo Botev. «Por eso, cuando se entra en las minucias de los casos de uso individualizados, es fácil que se encuentren fuera de su alcance: demasiado generalizados e incapaces de realizar las tareas específicas que se les exigen».

Botev añadió que la validez de las mediciones de Meta aún no se ha demostrado científicamente y su investigación no se ha publicado para su revisión por pares.

«Hacer una especie de revisión por pares a través de la publicación en los medios de comunicación de Meta crea un sesgo para futuras revisiones y pone presión pública sobre los revisores. Pero a pesar de todo esto, espero que estos puntos se aborden y sea una buena base para un gran trabajo en los próximos meses en PNL.»

10 cosas que necesitas saber directamente en tu bandeja de entrada cada día de la semana. Inscríbase en el Resumen diario El resumen de Silicon Republic de las noticias esenciales de ciencia y tecnología.