El MIT ha desarrollado una inteligencia artificial que edita las frases anticuadas en los artículos de la Wikipedia

Jose García

LaWikipedia, como wiki que es, es una plataforma colaborativa.Cualquier persona, entre comillas, puede editarla para añadir información, verificar un hecho, añadir una fuente o, por supuesto, actualizar un dato desfasado. No es una tarea sencilla, porque la Wikipedia tiene más de seis millones de artículos en inglés y 40 millones si sumamos todos los idiomas. Editar datos anticuados de todos ellos puede ser una tarea muy tediosa para los colaboradores humanos,pero no para una inteligencia artificial.

Eso es, precisamente, lo queha desarrollado el MIT, un sistema que se podría usar para “actualizar inconsistencias factuales en los artículos de la Wikipedia, reduciendo el tiempo y el esfuerzo de los editores humanos que hacen este trabajo manualmente”. Pensemos que la Wikipedia tiene artículos con cifras, cargos o ubicaciones que pueden ser cambiantes, por lo que la IA podría “estar pendiente” de estos cambios y actualizarlos automáticamente, aunque por ahora,el sistema requiere de cierta intervención humana.

Cambios en los datos manteniendo el lenguaje humano

Los investigadores explican que se trata de un sistema de generación de texto que “señala y reemplaza información específica en frases relevantes de Wikipedia”, pero “manteniendo el lenguaje similar a la forma en la que los humanos escriben y editan”. En un futuro, creen que existe la posibilidad decrear un sistema completamente automáticoque detecte las informaciones obsoletas y las actualice manualmente, pero por el momento se necesita de la intervención humana.

¿En qué sentido? En que para que el sistema funcione, el usuario debe escribir en una interfaz unaoración no necesariamente estructurada con la información actualizada, supongamos “XX persona tiene 30 años”. Introducido el dato, el sistema buscaría la página a la que se refiere la información, que sería en este caso la biografía de esa persona, y actualizaría el dato, reescribiendo la frase tal y como lo haría un humano. En pocas palabras, la IA es una especie de bot de automatización.

Precisamente por eso no es el primero, ya que existen bots que hacenediciones automáticas en la Wikipedia. La clave explica Darsh Shah, uno de los autores principales del artículo, es que esos bots se basan “en reglas”, es decir, que si tal palabra malsonante se pone en un artículo, sea eliminada, por ejemplo. La tarea de editar un artículo en la Wikipedia, explica Shah, “requiererazonar sobre partes contradictorias en dos frasesy generar un texto coherente”.

Los autores ponen el siguiente ejemplo. Supongamos que tenemos la frase:

“El Fondo A considera que28 de sus 42 participacionesminoritarias en empresas operativas son de particular importancia para el grupo”

Y que el dato debe cambiarse por lo siguiente:

“El Fondo A considera que23 de sus 43 participacionesminoritarias son significativas.

Hay que cambiar dos datos: 28 y 42 por 23 y 43. ¿Qué haría el sistema? Buscar el artículo del Fondo A y cambiarlos automáticamente, manteniendo la estructura de la frase y, por lo tanto, la concordancia del texto. Para conseguirlo, el sistema ha sido entrenado con un conjunto de datos basado en pares de oraciones: una reclamación y una frase relevante de la Wikipedia. Cada par fue etiquetado como “De acuerdo”, “En desacuerdo” o “neutral”.

El modelo analizó, en función de cómo estaban etiquetados los pares,qué palabras de la frase de la Wikipedia contradecían a las de la reclamación, reduciendo el número de palabras al mínimo (en el caso anterior, los datos 28 y 42) para ser lo más neutral posible. Hecho esto, un sistema de codificador-decodificar generaba la frase final.

¿El resultado? Según los investigadores, su modelo era más preciso al hacer actualizaciones factuales que otros sistemas de generación de textos (no identificados en el artículo). En otra prueba, unas personas puntuaron el modelo sobre cinco basándose en las frases resultantes y la nota fue de4 puntos en las actualizaciones de los hechos y de 3,85 en la gramática.

Vía |EngadgetImagen |Wikimedia Commonscon licenciaCC BY-SA 3.0