MineDojo: el agente inteligente de 'Minecraft' que ayudará a construir el futuro de la IA y el Deep Learning

Minecraft Portada Cropped
Sin comentarios Facebook Twitter Flipboard E-mail

‘Minecraft’ es uno de los títulos más populares en la historia del gaming, su importancia en el medio es incalculable y la cantidad de usuarios que se registran en su plataforma supera los 730 millones de jugadores. Sin embargo, de vez en cuando los videojuegos superan su medio y en esta ocasión ‘Minecraft’ ha llegado para ayudar en la investigación de la Inteligencia Artificial.

En Xataka México te contamos de que va todo este asunto, así como la forma en que aprende esta red neuronal llamada MineDojo y la razón detrás de escoger a ‘Minecraft’ como su patio de juegos.

Los tres puntos para sostener el futuro de la IA

MineDojo es uno de los empujes que en NVIDIA están tomando para crear los agentes inteligentes del futuro. Esta IA trabaja de manera autónoma y solo necesita que le dictes alguna orden como “arma un portal al Nether” para comenzar a trabajar. El fin detrás de esta red es construir bases para, en el futuro, elaborar inteligencias artificiales que exploren el mundo por su cuenta a la vez que se mejoran a sí mismas.

Un mundo abierto lleno de posibilidades

Minecraft Portada

NVIDIA seleccionó a ‘Minecraft’ para elaborar este tipo de red de aprendizaje automático que realice acciones generalistas gracias a tres motivos principales, que el investigador Jim Fan de NVIDIA lista en su Twitter.

En primer lugar, un entorno abierto que permite una variedad ilimitada de tareas y objetivos. La Tierra es un ejemplo, ya que es lo suficientemente rica como para forjar un árbol de formas de vida y comportamientos en constante expansión.

Se necesita un mundo en el cual exista una gran cantidad de acciones posibles por hacer, de preferencia, lo más cercano a nuestro mundo posible. ¿Cuántos títulos que cumplan con un mundo abierto tan basto como el de nuestro planeta?

‘Minecraft’ cuenta con todo lo necesario para ser ese escenario en el que se puedan hacer todo tipo de cosas, con un montón de herramientas y materiales distintos, así como entornos diferentes. Esa es la razón por la cual se seleccionó al juego de Mojang para recabar datos.

Una enorme base de datos

Minecraft 06
En segundo lugar, una base de conocimientos a gran escala que enseñe a una IA no sólo cómo hacer cosas, sino también cuáles son las cosas útiles que debe hacer.

Esto significa que necesitan un discriminante, una manera de hacer que la inteligencia artificial identifique cuáles son los pases necesarios para realizar cierta acción, haciendo la menor cantidad de movimientos posibles. Algo así como un algoritmo que aprenda a jugar “las Torres de Hanoi” (aquel juego en el que hay tres palos con una cierta cantidad de discos puestos sobre uno de ellos y que debes de pasar todos los discos de un lado a otro en la menor cantidad de pasos posibles) resolviendo el acertijo con la menor cantidad de movimientos necesarios.

Además, gracias a su enorme cantidad de jugadores, que alimentan la base de datos de este título, generando enormes cantidades de clips cada día, 'Minecraft' no hace más que seguir siendo el candidato perfecto. Pero no solo eso, con cada actualización llega más contenido al juego que va añadiendo capas de profundad a lo que se puede hacer en él, como la actualización presentada en el ‘Minecraft LIVE’.

Encima, los foros en Reddit y las páginas en la wiki del juego no hacen más que engrosar la cantidad de información que se pueden utilizar en entrenamientos de aprendizaje automático. Todo esto conforma lo que actualmente es la era de la información, en el cual se necesitan personas que sepan manejar los datos y, sobre todo, que sepan qué hacer con ellos. Como el proyecto del MineDojo.

Una red flexible y transformadora

Minecraft 05
En tercer lugar, una arquitectura de agentes lo suficientemente flexible como para llevar a cabo cualquier tarea en entornos abiertos, y lo suficientemente escalable como para convertir fuentes de conocimiento multimodal a gran escala en conocimientos procesables.

Aquí, se podría describir lo anterior como un embudo en el cual se filtra la información, no importa su naturaleza (texto, imagen, sonido, etc.), sea filtrada y adaptada para el aprendizaje. Es la parte más enfocada en materia de inteligencia artificial, pues aquí entran las redes neuronales que trabajarán los datos de esta inteligencia artificial.

El entrenamiento de la red

Minedojo

Para entrenar a la red, se utilizaron algo así como 730 mil fragmentos de videos de YouTube que contenían una transcripción descriptiva de cada acción en el video, sumando 2200 millones de palabras escritas. Además, recabaron 340 mil publicaciones de Reddit con 6.6 millones de comentarios que ayudan a describir acciones y construcciones en el juego, y siete mil páginas de la wiki de ‘Minecraft’.

La forma de aproximar el problema por parte del equipo de NVIDIA fue a través de un programa llamada MineCLIP. Este programa se encarga de ligar fragmentos de videos con una oración que describe la acción en el video. Esto permite que la inteligencia artificial pueda realizar tareas que van desde ordenes como “Pelea contra un Ender Dragon”, “Explora un monumento en el océano”, “Encuentra una pirámide en el desierto” o “Construye un Portal al Nether y entra”.

De esa manera, MineDojo es un primer avance para crear inteligencias artificiales generalizadas. Esto significa, que son los primeros pasos para que en el futuro tengamos agentes inteligentes que puedan moverse por su ecosistema de manera efectiva y casi por completo autónoma, sin necesidad de dirigirlos todo el rato.

Aplicaciones en el medio y un futuro luminoso

Minecraft 08 Cropped

Una posible aplicación para esto sería el de nuevos y mejores NPC para los videojuegos, en el que tengan una especie de “inteligencia” que los haga más realistas o más letales, algo parecido al programa Némesis que se implementó para ‘Lord of the Rings: Shadows of Mordor’, en el que un contrincante se encuentre varias veces contigo y aprenda tu estilo de juego para utilizarlo contra ti.

Sin embargo, su futuro va más allá del entretenimiento y quién sabe que nos depare la inteligencia artificial, que si a día de hoy ya nos rodea (¿Tienen un smartphone con cámara inteligente? Ahí está), en los próximos años nos va a inundar en todo tipo de áreas, desde las más mundanas hasta las más especializadas.

Gracias a un equipo de desarrolladores  de NVIDIA, se ha construido MineDojo, una IA que no solo ha ganado la conferencia NeurIPS de 2022, sino que también ha mostrado ser capaz de realizar actividades que le dictes por texto. Ya tendremos una excusa para cuándo nos cuestionen por jugar mucho en 'Minecraft', "¡Es por la ciencia!".

Inicio