ChatGPT no superará la inteligencia humana: Yann LeCun, director de IA en Meta y precursor del Deep Learning

Diseno Sin Titulo 12
Sin comentarios Facebook Twitter Flipboard E-mail

La inteligencia artificial es uno de los temas más emocionantes del momento, y recientemente Yann LeCun, líder de IA en Meta, ha dejado claro que los sistemas como ChatGPT no lograrán sobrepasar la inteligencia humana. Conocidos por estar entrenados con enormes cantidades de texto, LeCun considera que esto no desarrollará una lógica y comprensión avanzada del mundo.

Para ello, LeCun propone un enfoque distinto al de los modelos de lenguaje grandes (LLM). La principal apuesta de este investigador está en el "modelado del mundo". Pero, ¿de qué se trata este nuevo paradigma para la IA?

Antes de todo, es buena idea tener en cuenta quién es Yann LeCun, pues no se trata de cualquier investigador de IA. LeCun es un científico computacional que en 2018 recibió el Premio Turing, el mayor premio de las ciencias de la computación, debido a su contribución a la inteligencia artificial.

Además, LeCun es uno de "los padres" del Deep Learning como lo conocemos actualmente y fue el responsable de haber modelado las redes neuronales convolucionales (CNN). Las CNN son utilizadas en infinidad de aplicaciones en la actualidad, entre las que destacan los vehículos autónomos o la detección de objetos extragalácticos. De hecho, recientemente discutió con Elon Musk respecto a las CNN, pues el polémico millonario cree que ya son inservibles (craso error).

Pues bien, LeCun es toda una autoridad dentro del mundo de la IA y tanto el equipo de desarrollo en Meta como Mark Zuckerberg lo saben. Es por ello que actualmente lidera los esfuerzos de la compañía para la creación de una inteligencia artificial general (AGI). Las AGI son sistemas que van más allá de lo mostrado hasta ahora por los LLM como ChatGPT. Esto se debe a que buscan dar forma a un agente con la capacidad de entender, aprender y aplicar conocimiento de manera similar al humano.

El problema con los LLM como GPT, Gemini o Alphabet es que están condicionados a la información (generalmente solo texto) con la que son entrenados. De esa manera, sus respuestas están predeterminadas por lo que han leído con anterioridad, sea o no correcto, pues hemos visto que los LLM se equivocan en todo tipo de cosas. Podemos mencionar el caso del pegamento para pizza que recomendó utilizar la IA de Google.

El "modelado del mundo"

Diseno Sin Titulo 13

Para superar ese condicionamiento, LeCun propone el "world modelling" o modelado del mundo. La clave detrás del modelado del mundo es la capacidad que se busca para desarrollar una comprensión profunda y dinámica del entorno físico y social en el que se encuentra el agente inteligente. Este enfoque busca imitar la inteligencia de los humanos y animales.

Entre las múltiples diferencias que tiene el modelado del mundo con los LLM está que no solo se responderían preguntas basadas en datos ya existentes (texto en internet o libros), sino que se desarrollaría razonamiento de manera autónoma y efectiva. Eso es, más o menos, lo que se busca para las AGI.

El caso es que quieren crear máquinas que aprendan de la experiencia, como los niños. Además, contarían con memoria persistente para recordar información relevante, planificación jerárquica y comprensión de la física del mundo. Sin embargo, LeCun y Meta no son los únicos contendientes para el modelado de AGIs.

Como es natural pensar, el primero de los contendientes son los LLM. OpenAI y Google presentan mejoras continuas en sus sistemas de generación de texto, incluso mostrando cierto grado de razonamiento. DeepMind, por su lado, apuesta más que nada por el aprendizaje por refuerzo, utilizando técnicas como entornos simulados e incluso videojuegos, para que los agentes aprendan a interactuar con su entorno.

El modelado del mundo por el cual apuesta Meta es una opción más. Aunque LeCun piensa que podríamos tardar al menos una década en alcanzar a crear algo similar a una AGI, la tecnología cambia constantemente. Quizás en un par de años demos con el clavo para acelerar el proceso, o no. En cualquier caso, 10 años no suenan tan alejados dentro del "verano de la IA".

Inicio