Los investigadores de Meta han creado una nueva herramienta de IA de código abierto que puede escanear una gran cantidad de citas de enciclopedias a la vez, para comprobar si son precisas.

Meta afirma que esto es posible gracias a su modelo de IA denominado Sphere, que contiene un conjunto de datos de 134 millones de documentos extraídos de páginas web públicas. La empresa dijo que Sphere utiliza datos web abiertos en lugar de motores de búsqueda tradicionales para aprovechar mejor el «conocimiento del mundo real».

Meta dijo que ha desarrollado un modelo de Sphere que puede revisar y verificar con éxito las citas en Wikipedia. La empresa dijo que este modelo es capaz de verificar automáticamente cientos de miles de citas de Wikipedia a la vez.

Meta dijo que su objetivo es construir una plataforma que pueda ayudar a los editores de Wikipedia a detectar fácilmente los problemas de citación y corregir rápidamente el error, o corregir el contenido del artículo correspondiente a escala.

«Aunque Wikipedia es precisa, está bien formateada y es lo suficientemente pequeña como para que la mayoría de las arquitecturas puedan navegar por ella, también es de origen colectivo y no recoge todo el conocimiento disponible en la web», afirma Meta. «Y su continuo crecimiento ha hecho que sea un reto para los editores comprobar cada cita o los sesgos involuntarios».

Meta dijo que alimentó a sus algoritmos con 4 millones de afirmaciones de Wikipedia, enseñándoles a centrarse en una única fuente de un gran conjunto de páginas web para validar cada afirmación. A continuación, el modelo es capaz de clasificar la fuente citada y las alternativas recuperadas en función de la probabilidad de que respalden la afirmación.

«Cuando se implemente en el mundo real, el modelo ofrecerá las URL más relevantes como posibles citas para que un editor humano las revise y apruebe», dijo Meta.

Según Meta, Sphere representa «órdenes de magnitud más de datos» que otras fuentes de conocimiento utilizadas en tareas de respuesta a preguntas o comprobación de hechos, conocidas como sistemas de procesamiento de lenguaje natural con uso intensivo de conocimientos (KI-NLP).

«Como Sphere puede acceder a mucha más información pública que los modelos estándar actuales, podría proporcionar información útil que ellos no pueden», dijo Meta en un entrada del blog .

La empresa matriz de Facebook dijo que los sistemas KI-NLP suelen depender de los motores de búsqueda «comerciales de caja negra» para encontrar el conocimiento relevante de la web para responder a las preguntas, lo que puede llevar a que se pierda información por tener una baja clasificación en los algoritmos de búsqueda.

Meta dijo que Sphere es de código abierto y pretende convertirlo en una fuente universal de conocimiento que pueda resolver múltiples tareas KI-NLP a la vez.

La empresa afirma que, con el tiempo, estos modelos podrían hacer frente a los contenidos web nocivos y mejorar las competencias de las personas en materia de alfabetización digital y pensamiento crítico, cuando se combinan con una interfaz de usuario bien diseñada.

A pesar de que una versión de la herramienta de IA se está probando en artículos de Wikipedia, Meta dijo que no se está asociando con la empresa matriz Wikimedia en este proyecto. Meta añadió que Sphere aún está en fase de investigación y que no se está utilizando para actualizar automáticamente el contenido de Wikipedia.

La semana pasada, Meta lanzó una herramienta de traducción de inteligencia artificial que, según la empresa funciona en 200 idiomas diferentes . La empresa tecnológica dijo que las lecciones de este proyecto de código abierto se están aplicando a los sistemas de traducción utilizados por los editores de Wikipedia.

10 cosas que necesitas saber directamente en tu bandeja de entrada cada día de la semana. Inscríbase en el Resumen diario El resumen de Silicon Republic de las noticias esenciales de ciencia y tecnología.