La académica Animashree Anandkumar y el futuro físico de la IA
La académica relata los desafíos y oportunidades para la inteligencia artificial de próxima generación, además de su trayectoria en el desarrollo de modelos que integran esta tecnología.
- T+
- T-
Una de las invitadas estrella del Congreso Futuro 2024 fue la profesora Bren de Computación en el Instituto de Tecnología de California (Caltech), Animashree Anandkumar. Recientemente dejó su cargo de directora senior de investigación sobre aprendizaje automático en Nvidia, donde lideró el grupo que desarrolla algoritmos de inteligencia artificial (IA) de próxima generación.
Anandkumar abrió la tercera jornada del evento, donde señaló los diferentes avances que ha permitido la IA y su impacto en la investigación científica, la mitigación del cambio climático y la predicción del avance de pandemias. Durante la exposición, la académica afirmó que “el futuro de la IA es físico, va más allá del ámbito virtual de los modelos de texto, y para que sea físico, lo que nos gustaría es que tuviera una encarnación”.
En entrevista con DF, Anandkumar comentó que la principal forma de traducir la IA en el reino físico es “a través de la robótica como un cuerpo físico”.
- ¿Cuáles son los desafíos que supone hoy la IA y qué falta para su perfeccionamiento?
- Hoy la IA es popular en modelos de texto, como ChatGPT o modelos de imagen, pero el mundo del conocimiento va mucho más allá del texto y las imágenes cuando se trata de comprender y simular el mundo en el que vivimos. El texto puede dar algún tipo de comprensión y un conocimiento de alto nivel, pero para ir realmente a simular y probar cosas nuevas, ir a un laboratorio físico puede ser muy caro. Si pudiéramos hacerlo virtualmente con la IA, que internamente simula y entiende estos procesos, puede ser un cambio mundial.
- ¿Cómo podemos aprovechar las oportunidades que ofrece la IA?
- El mayor aspecto de aprovechar los beneficios es democratizar y hacer que esté disponible en todo el mundo. Para que sea sostenible y posible es con el código abierto, ya que esto ha permitido todos los avances que vemos hoy en día. Es importante que países como Chile inviertan localmente en educación e infraestructura de IA; que proporcionen a los investigadores recursos para continuar entrenando los modelos; y que integren el conocimiento, idioma y cultura local.
Su paso por Nvidia y Caltech
- Nvidia es un actor importante en la fabricación y desarrollo de GPU con IA, ¿de qué manera han cambiado el escenario computacional?
- Las GPU o unidades de procesamiento gráfico están aceleradas para operaciones específicas, necesarias para el entrenamiento de la IA y que esta funcione. Los ordenadores tradicionales están diseñados en un propósito general, puedes hacer todo tipo de tareas, pero son mucho más lentos. Gracias al desarrollo de las GPU, hemos entrenado grandes modelos de IA, transformando diferentes campos de la ciencia y tecnología. Por ejemplo, hemos entrenado un modelo meteorológico de código abierto, que puedes descargarlo y ejecutarlo en tu escritorio local.
Ahora podemos hacer simulaciones un millón de veces más rápido que con los métodos tradicionales. Podemos diseñar e innovar y probar todo virtualmente antes de pasarlo al mundo físico. Ese es el poder de la computación acelerada y la IA unidas.
- En el Caltech desarrollaron el Fourier Neural Operator, un sistema que permite que la IA aprenda y resuelva una serie de ecuaciones complejas, ¿cuáles son los potenciales usos de esta tecnología?
- Los Operadores Neuronales de Fourier permiten resolver las ecuaciones diferenciales parciales que se producen en todos los procesos naturales, y los procesos artificiales que se muestran son impulsados por estas ecuaciones. En mi charla mostré los ejemplos de cómo el coronavirus se une en nuestro cuerpo humano, lo que se describe como “dinámica molecular”. La unión de las moléculas se puede describir con ecuaciones que ayudan a modelar el mundo físico que nos rodea.
Los operadores neuronales son métodos de IA que permiten aprender de los datos y usar el conocimiento físico para llegar a soluciones de alta fidelidad. Estos pueden sustituir los métodos tradicionales, siendo más rápidos y baratos.
- ¿En qué sectores o industrias se puede aplicar esta tecnología?
- Puede aplicarse a la modelización meteorológica, a la comprensión de la fusión nuclear, a la obtención de imágenes por ultrasonidos. También puede ayudar a entender cómo se estiran y deforman los materiales, y cómo se unen las moléculas entre sí. Las posibilidades son inmensas.
La IA del futuro
- En tu charla mencionaste que el futuro de la IA es físico, ¿de qué manera aterrizamos esta tecnología al mundo físico?
- La principal forma de traducir la IA al reino físico podría ser mediante la robótica como cuerpo físico. Por ejemplo, si necesitas diseñar mejor un avión, puedes leer todos los libros de texto, pero realmente necesitas ir a probar diferentes formas, lo que físicamente es muy caro. Si la IA entiende cómo cambiar la aerodinámica de las hélices de avión, puede optimizar internamente y crear una mejor. Así es como podemos llegar a mejores inventos, mucho más rápido y barato con la IA, en comparación con lo que estamos haciendo hoy con procesos de ensayo y error.
Mi objetivo es construir este tipo de entendimiento físico universal, un modelo que entienda diferentes áreas de la ciencia juntas, que pueda realmente modelar escenarios muy complejos denominados “escenarios multifísicos”, entornos complejos simulados internamente dentro de modelos de IA para llegar a mejores invenciones y diseños.