La nueva inteligencia artificial de Google DeepMind puede seguir órdenes en juegos 3D que nunca ha visto antes

Convierte a tu AI en un jugador experto con DeepMind

DeepMind, la compañía de inteligencia artificial de Google, ha dado un paso más en su investigación con la presentación de un nuevo agente de IA que puede realizar una serie de tareas en juegos 3D que nunca antes había visto. El equipo ha estado experimentando durante mucho tiempo con modelos de IA que pueden ganar en juegos como Go y ajedrez, e incluso aprender juegos sin que se les indiquen sus reglas. Ahora, por primera vez, según DeepMind, un agente de IA ha demostrado que puede comprender una amplia gama de mundos de juego y llevar a cabo tareas dentro de ellos basándose en instrucciones en lenguaje natural.

Entrenamiento con juegos

Los investigadores se asociaron con estudios y editores como Hello Games (No Man’s Sky), Tuxedo Labs (Teardown) y Coffee Stain (Valheim y Goat Simulator 3) para entrenar al Agente Multiworld Instructable Escalable (SIMA) en nueve juegos. El equipo también utilizó cuatro entornos de investigación, incluido uno construido en Unity en el que los agentes reciben instrucciones para formar esculturas utilizando bloques de construcción. Esto le dio a SIMA, descrito como “un agente de IA generalista para entornos virtuales 3D”, una variedad de entornos y configuraciones para aprender, con una variedad de estilos y perspectivas gráficas (en primera y tercera persona).

Un agente generalista para entornos virtuales 3D

“Cada juego en la cartera de SIMA abre un nuevo mundo interactivo, incluida una variedad de habilidades para aprender, desde una simple navegación y uso de menús, hasta la extracción de recursos, volar una nave espacial o crear un casco”, escribieron los investigadores en una publicación de blog. Aprender a seguir instrucciones para realizar tales tareas en mundos de videojuegos podría llevar a agentes de IA más útiles en cualquier entorno, señalaron.

Un diagrama de flujo que detalla cómo Google DeepMind entrenó a su agente de IA SIMA. El equipo utilizó videos de juego y los emparejó con entradas de teclado y mouse para que la IA aprendiera.

Entrenamiento con humanos

Los investigadores grabaron a humanos jugando los juegos y anotaron las entradas de teclado y mouse utilizadas para llevar a cabo acciones. Utilizaron esta información para entrenar a SIMA, que tiene “un mapeo preciso de imagen-idioma y un modelo de video que predice lo que sucederá a continuación en la pantalla”. La IA es capaz de comprender una variedad de entornos y llevar a cabo tareas para lograr un objetivo determinado.

Un agente que no necesita el código fuente del juego

Los investigadores dicen que SIMA no necesita el código fuente del juego ni acceso a la API: funciona en versiones comerciales de un juego. También solo necesita dos entradas: lo que se muestra en la pantalla y las instrucciones del usuario. Dado que utiliza el mismo método de entrada de teclado y mouse que un humano, DeepMind afirma que SIMA puede operar en casi cualquier entorno virtual.

Resultados del entrenamiento

El agente SIMA se evalúa en cientos de habilidades básicas que se pueden llevar a cabo en unos 10 segundos en varias categorías, incluida la navegación (“girar a la derecha”), la interacción con objetos (“recoger setas”) y tareas basadas en menús, como abrir un mapa o crear un artículo. Eventualmente, DeepMind espera poder ordenar a los agentes que realicen tareas más complejas y de varias etapas basadas en indicaciones en lenguaje natural, como “encontrar recursos y construir un campamento”.

Resultados del entrenamiento

En términos de rendimiento, SIMA tuvo un buen desempeño en función de varios criterios de entrenamiento. Los investigadores entrenaron al agente en un juego (digamos Goat Simulator 3, por el bien de la claridad) y lo hicieron jugar ese mismo título, utilizando eso como referencia para el rendimiento. Un agente SIMA que fue entrenado en los nueve juegos tuvo un rendimiento mucho mejor que un agente que se entrenó solo en Goat Simulator 3. El equipo también probó el agente en un juego que no había visto antes, Teardown, y pudo completar tareas en ese juego tan bien como un humano.

Conclusión

En resumen, DeepMind ha logrado un gran avance en la investigación de la inteligencia artificial con su nuevo agente SIMA. Este agente es capaz de comprender una amplia gama de entornos de juego y llevar a cabo tareas en ellos basándose en instrucciones en lenguaje natural. Esto podría tener un gran impacto en el desarrollo de agentes de IA más útiles en cualquier entorno, lo que podría llevar a una mayor automatización y eficiencia en una variedad de industrias. Además, el hecho de que SIMA no necesite el código fuente del juego ni acceso a la API lo hace aún más impresionante y versátil. Sin duda, seguiremos viendo más avances en la investigación de la inteligencia artificial en el futuro cercano gracias a DeepMind y su agente SIMA.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Scroll al inicio