Meta, la compañía detrás de Facebook, ha encontrado un problema en Wikipedia: solamente el 20% de las biografías de la plataforma son de mujeres. Para solucionarlo, están investigando un nuevo sistema de IA capaz de buscar información y escribir por su cuenta los primeros borradores de las publicaciones al estilo de las entradas en Wikipedia.
Esto es, según detalla Angela Fan, investigadora de Meta AI, con la intención de construir un nuevo sistema que algún día ayude a los editores de Wikipedia a crear miles de entradas biográficas sobre personas importantes que aún no están en el sitio, y en especial de grupos marginados de los que se cuenta con muy poca información.
Aquí puedes ver la introducción al modelo de IA
Una forma de combatir la falta de información
Este modelo busca generar un punto de partida para crear automáticamente artículos biográficos de "alta calidad" sobre personajes públicos importantes para el mundo real.
Para esto, el sistema busca información en sitios web y redacta la publicación con el formato de Wikipedia, incluyendo las respectivas fuentes, aunque tiene un problema central: el sistema de generación de textos puede "alucinar" contenidos y perder la coherencia en la redacción, razón por la que necesita de un editor que verifique el sentido y la lógica en cada uno de los párrafos.
Meta señala que esperan solucionar esto gracias a los avances de las arquitecturas neuronales que alimentan estos modelos, y los avances en el desarrollo de la IA, permitiendo a usuarios no expertos producir artículos precisos con los cuales sumar información a la web, requiriendo de una edición mínima en el contenido.
Así funciona la IA de Meta para escribir contenidos
El proceso de creación de una biografía comienza con una "arquitectura de generación aumentada por la recuperación", que usa un pre entrenamiento a gran escala donde se le enseña al modelo a identificar información relevante del perfil, como el lugar de nacimiento, o donde asistió a la escuela.
Después se recupera información relevante en internet para introducir el tema, tras lo que se genera el texto y el módulo de citas que constituirá a la sección de bibliografía con enlaces a las fuentes utilizadas.
Luego se repite por sección el mismo proceso, donde cada párrafo previo sirve para predecir el siguiente, cubriendo así todos los elementos que se deberían encontrar en una "biografía robusta" de Wikipedia, incluyendo los primeros años de vida, la educación y la carrera del personaje.
Estas secciones se generan usando un mecanismo de almacenamiento caché, que permite hacer referencia a párrafos escritos previamente, para dar un mayor contexto al documento y hacer un mejor seguimiento al texto previo.
Una herramienta que todavía necesita ser pulida
En los resultados Meta AI pudo demostrar que el modelo es capaz de encontrar información relevante y usarla para elaborar biografías, donde el 68% del texto generado no se encontraba en los textos de referencia, que puede significar varias cosas. Por un lado que la IA es capaz de encontrar y sintetizar la información relevante sin ser un bot de plagio, pero también que no se puede comprobar que datos sí son relevantes o no.
Para esto se preguntó a un grupo de evaluadores, quienes encontraron que en muchos casos las oraciones eran solo parcialmente verificables, que se multiplicaban en grupos marginados, pues hay pocos datos sobre ellos y el sistema tiende a especular sobre ellos.
Otros problemas también fueron encontrados en la investigación: la falta de datos y artículos sobre mujeres, especialmente de los grupos marginados derivó en que hubiera menos información, con menor nivel de detalle y hasta con lenguaje diferente, pues se usaban términos "mujer científica" en lugar de "científica" lo que también generó un sesgo en el entrenamiento.
Por el momento el modelo se encuentra únicamente en investigación y no hay un elemento de producción o colaboración de Wikipedia. Meta señala que incluso por parte de la plataforma no hay la intención para utilizar la IA como parte de su servicio.
El objetivo más bien es tener un punto de partida para en el futuro poder corregir los desequilibrios presentes en el contenido biográfico que existe en la web, aprovechando las capacidades de la Inteligencia Artificial.
Ver todos los comentarios en https://www.xataka.com.mx
VER 0 Comentario