Lo último de OpenAI es un modelo de inteligencia artificial que resume ‘Alicia en el País de las Maravillas’ en 136 palabras
Jose García
Lo que OpenAI está consiguiendo conGPT-3es, en pocas palabras, impresionante. Este nuevo modelo de lenguaje escapaz de programar,diseñar,mantener conversaciones sobre temas complejosde forma fluida y, ahora,resumir libros enteros en un par de frases.
El sistema funciona de una forma bastante peculiar. En lugar de resumir el libro completo de una sola vez,lo hace reduciendo la tarea en tareas más pequeñas. Primero resume el texto original en secciones, luego resume esas secciones, que a su vez son resumidas en secciones más pequeñas y, finalmente, se consigue un resumen mucho más corto con la idea principal del libro.
De 24.449 a 136 palabras
De acuerdo a OpenAI, su modelo ajustado a partir de GPT-3 genera “resúmenes sensatos de libros entero incluso igualando la calidad media de los resúmenes escritos por humanos”. Aseguran que tieneuna precisión de seis sobre sietecon respecto a los humanos que han leído el libro el 5% de las veces y de cinco sobre siete con respecto a los humanos que han leído el libro el 15% de las veces.
Para demostrarlo, OpenAI ha publicado unaserie de resúmenes de libros en su web, pero a continuación mostramos traducidos losresúmenes de ‘Alicia en el País de las Maravillas’ y ‘Romeo y Julieta’para que nos hagamos una idea:
Según explica la compañía, los modelos grandes entrenados previamente no son buenos para resumir. Una forma de mejorarlos esentrenarlos con comentarios de los humanos, pero eso requiere que dichos humanos hayan leído el libro entero y es algo que podría llevar horas.
¿Solución? Ladescomposición recursiva de tareas, o lo que es lo mismo, dividir una tarea difícil en otras más fáciles. Eso permite a los humanos evaluar los resúmenes más rápidamente y, evidentemente, permite al modelo resumir libros de cualquier longitud.
OpenAI entrenó al modelo con un dataset de libros, mayormente de ficción, que conteníanunas 100.000 palabras de media. Para evaluar el modelo, seleccionaron los 40 libros más populares de 2020 y encargaron a dos personas que los leyeran, hicieran un resumen y luego evaluaran el resumen hecho por la IA.
El resultado es bueno, perono está exento de problemas. Algunos de los más destacables es que puede generar afirmaciones inexactas (algo que puede deberse a la falta de contexto derivada de simplificar una tarea grande en tareas peque´ñas) y que, en algunas ocasiones, el resumen se convierte en una lista de los eventos importantes que hay en el libro.
En declaraciones aVentureBeat, OpenAI ha confirmado que la compañía “no tiene places de hacer disponible públicamente u open source el modelo de resumen de libros”.
Vía |OpenAI