Los investigadores llevan tiempo queriendo construir una máquina capaz de pensar y actuar como un humano. Aunque todavía no lo hemos conseguido, un nuevo sistema de IA desarrollado por DeepMind podría habernos acercado un poco más.

Gato es la última IA de DeepMind que puede realizar más de 600 tareas diferentes, como jugar a videojuegos, subtitular imágenes y mover brazos robóticos del mundo real.

La idea de Gato es crear un sistema de IA «generalista» que pueda realizar muchas tareas diferentes que los humanos pueden hacer, sin hacerse un hueco como experto en una tarea. Esencialmente, en lo que respecta a la inteligencia artificial, se trata de un gato de todos los oficios y un maestro de ninguno.

«Inspirados por los avances en el modelado del lenguaje a gran escala, aplicamos un enfoque similar hacia la construcción de un único agente generalista más allá del ámbito de las salidas de texto», escribió DeepMind, que es la filial de IA de Alphabet, en un blog la semana pasada.

Descrita como una «política generalista multimodal, multitarea y multiempresa», DeepMind, con sede en el Reino Unido, dijo que Gato puede jugar a Atari, subtitular imágenes, apilar bloques con un brazo robótico real y mucho más, decidiendo en cada caso «si emitir texto, torsiones de las articulaciones, pulsaciones de botones u otros tokens».

Es similar al Generador de texto GPT-3 de OpenAI en el sentido de que acepta la entrada del usuario y realiza tareas, aprendiendo de su práctica basada en miles de millones de entradas anteriores. Pero DeepMind es más pequeño que GPT-3 en términos de parámetros, y se diferencia de otros sistemas por la amplia gama de tareas que puede realizar.

“It sounds exciting that the AI is able to do all of these tasks that sound very different, because to us it sounds like writing text is very different to controlling a robot,” Mike Cook, a member of the Knives & Paintbrushes research collective, dijo a TechCrunch la semana pasada.

«Pero en realidad, esto no es muy diferente de que GPT-3 entienda la diferencia entre un texto en inglés ordinario y el código Python».

Una ilustración de algunas de las diferentes tareas que puede realizar Gato.

Una ilustración de algunas de las diferentes tareas que puede realizar Gato. Imagen: DeepMind

Cook explicó que Gato recibe datos de entrenamiento específicos para estas tareas «como cualquier otra IA de su tipo» y aprende cómo se relacionan los patrones en los datos, incluso aprendiendo a asociar ciertos tipos de entradas con ciertos tipos de salidas.

«Esto no quiere decir que sea fácil, pero para el observador externo puede parecer que la IA también puede hacer una taza de té o aprender fácilmente otras 10 o 50 tareas, y no puede hacer eso. Creo que es un buen trabajo, pero no me parece un peldaño importante en el camino hacia nada».

DeepMind afirma que Gato se entrena con un gran número de conjuntos de datos que comprenden «la experiencia de los agentes tanto en entornos simulados como en el mundo real», además de una variedad de conjuntos de datos de lenguaje natural e imágenes.

En un trabajo de investigación publicado la semana pasada, DeepMind también afirma que para muchas de las 600 tareas que un modelo Gato preentrenado puede hacer, puede superar a los humanos.

A principios de este año, DeepMind creó un nuevo sistema potenciado por la IA llamado AlphaCode, que, según dijo, puede escribir programas informáticos « a un nivel competitivo «.

10 cosas que necesitas saber directamente en tu bandeja de entrada cada día de la semana. Inscríbase en el Resumen diario El resumen de Silicon Republic de las noticias esenciales de ciencia y tecnología.