La empresa detrás de ChatGPT y de potenciar el nuevo Bing de Microsoft, OpenAI ha dado a conocer finalmente la nueva versión de su modelo de lenguaje que utiliza Inteligencia Artificial.
De acuerdo con la compañía se trata de una nueva generación del modelo ya presente en el buscador de Microsoft, que acepta entradas tanto de texto, al igual que con la versión GPT-3, pero que ahora también soporta imágenes aunque las respuestas se mantienen únicamente de forma escrita.
A pesar de que OpenAI clasifica a GPT-4 como "menos capaz que los humanos en muchos escenarios del mundo real, cuenta con un rendimiento a nivel humano en varios entornos académicos y profesionales".
La compañía detalla que esta nueva versión de la IA es más confiable, creativa, y puede manejar instrucciones mucho más matizadas que su modelo más reciente, el GPT-3.5. Además, GPT-4 supera "considerablemente" a los modelos de lenguaje existentes y a la mayoría de los modelos de última generación.
Así funciona el nuevo GPT-4
GPT-4 puede aceptar indicaciones de texto e imágenes y al mismo tiempo aceptar que el usuario especifique cualquier tarea a realizar o el idioma a utilizar.
Según la compañía, el modelo acepta desde documentos con texto, fotografías, diagramas o hasta capturas de pantalla, mostrando un comportamiento similar al de las entradas de solo texto.
Eso sí, OpenAI señala que de momento, las entradas de imágenes siguen siendo una vista previa de la investigación y aún no estarán disponibles públicamente.
Las limitaciones de GPT-4
A pesar de las nuevas capacidades de la IA, la compañía también revela que este modelo tiene unas limitaciones similares al resto de los modelos GPT anteriores por lo que "todavía no es completamente confiable", pues alucina hechos y comete errores de razonamiento.
OpenAI también aclara que es necesario tener cuidado al utilizar los resultados del modelo en contextos de alto riesgo, y en casos de requerir de un protocolo exacto, se necesita de una revisión humana, contexto adicional o evitar su uso por completo de acuerdo a la situación.
A pesar de ser "un problema real", dice OpenAI, GPT-4 si reduce "significativamente" las alucinaciones en comparación con los modelos anteriores, siendo un 40% más eficiente que GPT-3.5 en las mismas evaluaciones.
Al igual que con ChatGPT, GPT-4 tiene un sesgo en el conocimiento de eventos que ocurrieron después de septiembre de 2021, y no aprende de su experiencia, cometiendo también errores de razonamiento simple o siendo "demasiado crédulo" al aceptar declaraciones falsa obvias de un usuario.
"Conteniendo" a la IA de GPT-4
La empresa también revela que para hacer a GPT-4 "más seguro y alineado", se han realizado trabajos de selección y filtrado de datos previos, evaluaciones y participación de expertos.
Ya que este modelo presenta riesgos similares a los modelos anteriores, pudiendo por ejemplo generar consejos dañinos, código con errores o información inexacta, se contrató a más de 50 expertos en temas como alineación de IA, ciberseguridad, riesgo biológico, confianza y seguridad internacional para probar al modelo de forma "adversaria".
Esto permitió que se estudiara el comportamiento del modelo en áreas de alto riesgo, y a partir de los comentarios y datos de expertos se implementaron mitigaciones y mejoras para el modelo que le dan a GPT-4 por ejemplo, la capacidad para rechazar solicitudes sobre cómo sintetizar sustancias químicas peligrosas.
Según OpenAI, sus mitigaciones han hecho posible reducir la tendencia del modelo a responder solicitudes de contenido no permitido en un 82% en comparación con GPT-3.5, además de que GPT-4 responde a solicitudes confidenciales, como consejos médicos y autolesiones, según las políticas de la empresa con una frecuencia de 29% más en comparación al modelo anterior.
El entrenamiento de GPT-4
La empresa detalla que para esta nueva generación, el modelo base se entrenó para predecir la siguiente palabra en un documento usando datos disponibles públicamente, así como datos licenciados.
Estos datos incluyen desde soluciones correctas e incorrectas a problemas matemáticos, razonamiento, afirmaciones auto contradictorias y consistentes, así como una gran variedad de ideologías e ideas.
Cuando se le solicita una pregunta, el modelo aprovecha la variedad de datos que pueden estar lejos del resultado esperado por el usuario, para lo que se estará ajustando el comportamiento de GPT-4 con aprendizaje de refuerzo con retroalimentación humana.
ChatGPT Plus
Para quienes ya están suscritos a ChatGPT Plus (que también se puede adquirir en México), la compañía señala que obtendrán acceso al nuevo modelo con un límite de uso.
Estos parámetros serán ajustados constantemente según la demanda y el rendimiento del sistema, pero se espera tener una "capacidad muy limitada", aunque se ampliará en los próximos meses y no se descarta la llegada de un nuevo nivel de suscripción exclusivo para utilizar GPT-4 en un mayor volumen.
En el caso de los usuarios que utilizan la versión gratuita, "una cierta cantidad de consultas" con GPT-4 llegará en algún momento, con la intención de que también puedan probar las capacidades de la IA.
Ver 2 comentarios