Transformación Digital

Los investigadores tienen una herramienta mágica para comprender la IA: Harry Potter

Un número creciente de investigadores está utilizando los libros más vendidos de Harry Potter para experimentar con tecnología de inteligencia artificial generativa.

Por: Bloomberg | Publicado: Martes 26 de diciembre de 2023 a las 12:23 hrs.
  • T+
  • T-
Foto: Bloomberg
Foto: Bloomberg

Compartir

Más de dos décadas después de que J.K. Rowling presentó al mundo un universo de criaturas mágicas, bosques prohibidos y un mago adolescente, Harry Potter está encontrando una relevancia renovada en un cuerpo de literatura muy diferente: la investigación de la IA.

Un número creciente de investigadores está utilizando los libros más vendidos de Harry Potter para experimentar con tecnología de inteligencia artificial generativa, citando la influencia duradera de la serie en la cultura popular y la amplia gama de datos lingüísticos y complejos juegos de palabras dentro de sus páginas. Revisar una lista de estudios y artículos académicos que hacen referencia a Harry Potter ofrece una instantánea de la investigación de vanguardia en IA y algunas de las preguntas más espinosas que enfrenta la tecnología.

Quizás en el ejemplo reciente más notable, Harry, Hermione y Ron protagonizan un artículo titulado "¿Quién es Harry Potter?" que arroja luz sobre una nueva técnica que ayuda a modelos de lenguaje grandes a olvidar información de forma selectiva. Es una tarea de alto riesgo para la industria: los grandes modelos de lenguaje, que impulsan los chatbots de IA, se basan en grandes cantidades de datos en línea, incluido material protegido por derechos de autor y otros contenidos problemáticos. Esto ha dado lugar a demandas y escrutinio público para algunas empresas de IA.

Los autores del artículo, los investigadores de Microsoft Mark Russinovich y Ronen Eldan, dijeron que han demostrado que los modelos de IA se pueden alterar o editar para eliminar cualquier conocimiento de la existencia de los libros de Harry Potter, incluidos los personajes y las tramas, sin sacrificar las habilidades analíticas y de toma de decisiones generales del sistema de IA.

El dúo dijo que eligieron los libros por su familiaridad universal. "Creímos que sería más fácil para la gente de la comunidad de investigación evaluar el modelo resultante de nuestra técnica y confirmar por sí mismos que el contenido efectivamente ha sido 'desaprendido'", dijo Russinovich, director de tecnología de Microsoft Azure. “Casi cualquiera puede proponer indicaciones para el modelo que permitan comprobar si 'conoce' o no los libros. Incluso las personas que no han leído los libros conocerán los elementos de la trama y los personajes”.

En otro estudio, investigadores de la Universidad de Washington en Seattle, la Universidad de California en Berkeley y el Instituto Allen de IA desarrollaron un nuevo modelo de lenguaje llamado Silo que puede eliminar datos para reducir los riesgos legales. Sin embargo, el rendimiento del modelo disminuyó significativamente si se entrenaba sólo con textos de bajo riesgo, como libros sin derechos de autor o documentos gubernamentales, dijeron en un artículo publicado a principios de este año.

Para profundizar más, los investigadores utilizaron libros de Harry Potter para ver si fragmentos de texto individuales influyen en el rendimiento de un sistema de inteligencia artificial. Crearon dos almacenes de datos o colecciones de sitios web y documentos. El primero incluía todos los libros publicados excepto el primer libro de Harry Potter; otro incluía todos los libros de la serie menos el segundo, y así sucesivamente. "Cuando los libros de Harry Potter se eliminan del datastore, la perplejidad empeora", dijeron los investigadores, refiriéndose a la medida de precisión de los modelos de IA.

Ayuda y referencia fundamental

Los estudios de IA han citado a Harry Potter durante al menos una década, pero se ha vuelto más común a medida que académicos y tecnólogos se han centrado en herramientas de IA que pueden procesar y responder al lenguaje natural con respuestas relevantes. Con Harry Potter, "la abundancia de escenas, diálogos y momentos emocionales lo hacen muy relevante para el área específica del procesamiento del lenguaje natural", dijo Leila Wehbe, investigadora de Carnegie Mellon que realizó una serie de experimentos en 2014 recopilando datos de resonancia magnética cerebral de personas mientras leen historias de Harry Potter para comprender mejor los mecanismos del lenguaje.

En arXiv, un repositorio de investigación científica de acceso abierto, artículos recientes incluyen "Aprendizaje automático para el desarrollo de pociones en Hogwarts", "Grandes modelos de lenguaje conocen a Harry Potter" y "Detección de hechizos en la literatura fantástica con una inteligencia artificial basada en transformadores".

Incluso cuando no es central para la investigación, Harry Potter es también una referencia literaria favorita para los investigadores. Un estudio, por ejemplo, utilizó los trabajos de Rowling para probar la inteligencia de sistemas de inteligencia artificial como los que generaron el chatbot ChatGPT, un tema que ha generado mucho debate en los debates recientes. Terrence Sejnowski, director del laboratorio de neurobiología computacional del Instituto Salk de Estudios Biológicos, argumentó en el artículo que los chatbots simplemente reflejan la inteligencia y los prejuicios de sus usuarios, como el Espejo de Erised en el primer libro de Harry Potter, que refleja los deseos de una persona. volver a ellos

"Harry Potter es popular entre los investigadores más jóvenes", afirmó Wehbe. “Los habrían leído cuando eran niños o adolescentes, pensando así en ellos a la hora de elegir un corpus de texto escrito o hablado”.

Lo más leído