Este jueves, OpenAI presentó una herramienta de Inteligencia Artificial (IA) que puede ayudar a reservar vuelos, planificar pedidos de supermercado e incluso completar compras para los usuarios, uniéndose a un número creciente de empresas tecnológicas que apuestan por los llamados agentes de IA que actúan a nombre de una persona.
El servicio, llamado Operator, puede realizar una amplia gama de tareas utilizando Internet de manera similar a como lo haría un humano, incluyendo navegar en sitios web, escribir y hacer "clic" en botones, según informó OpenAI en una transmisión en vivo. El software de Operator combina algunas de las funciones de visión por computadora de OpenAI con capacidades de resolución de problemas en múltiples pasos, diseñadas para imitar cómo razonan las personas, explicó la compañía.
Software de agentes
Inicialmente, OpenAI está lanzando lo que llama una "vista previa de investigación" de Operator en línea para un número limitado de clientes en Estados Unidos que pagan US$ 200 al mes por la suscripción recientemente introducida de ChatGPT Pro. La compañía afirmó que espera aprender de los primeros usuarios de Operator para mejorar el producto y planea ofrecerlo a más clientes de pago con el tiempo.
El lanzamiento de Operator forma parte de un movimiento más amplio de la industria hacia agentes, o software de IA que puede completar tareas complejas para los usuarios con mínima supervisión. Microsoft, que respalda a OpenAI, y su competidor Anthropic también han lanzado sus propias versiones de software de agentes, al igual que varias otras startups. Las empresas esperan que estas herramientas ahorren tiempo a los usuarios en sus tareas personales y profesionales, cumpliendo así con la promesa de que la IA hará a las personas más productivas. Sam Altman, CEO de OpenAI, afirmó anteriormente que los agentes serán “el próximo gran avance” de la IA.
En una demostración de la herramienta realizada el miércoles, Peter Welinder, vicepresidente de productos de OpenAI, y Yash Kumar, líder de productos e ingeniería de Operator, mostraron cómo la herramienta podía hacer una reservación en un restaurante o reconocer los elementos de una lista escrita a mano para preparar un pedido de supermercado en línea. Kumar explicó que OpenAI se asoció con varias empresas, incluyendo Instacart, OpenTable, Uber y StubHub para garantizar que Operator funcione bien en sus sitios web.
Durante la demostración, Kumar le pidió a Operator que utilizara OpenTable para reservar una mesa en el restaurante Beretta de San Francisco alrededor de las 19 horas. La herramienta abrió una ventana de navegador remoto, ingresó al sitio web de OpenTable y buscó el restaurante, pero inicialmente no lo encontró. Resultó que OpenTable estaba configurado para buscar restaurantes en Iowa, no en California. Sin embargo, Kumar había indicado previamente a Operator que buscara dentro de un código postal específico de San Francisco, por lo que la herramienta corrigió automáticamente la ubicación y ofreció una reserva para que él la aprobara.
“Vemos mucho potencial en cómo esto puede evolucionar, desde cosas pequeñas hasta medianas y grandes”, dijo Kumar a Bloomberg News. Comentó que personalmente ha estado utilizando Operator para hacer sus compras de supermercado y reservar canchas de tenis.
Operator también puede realizar múltiples tareas al mismo tiempo. Por ejemplo, un usuario podría pedir al servicio que encuentre un hotel en Vancouver con bicicletas Peloton en su gimnasio y, antes de que termine, solicitar que busque una cama para muñecas American Girl en Craigslist. Siempre que el usuario haya confirmado que Operator puede realizar una transacción —como comprar un par de calzas en una tienda en línea— e ingresado las credenciales necesarias y la información de pago, la herramienta debería ser capaz de completar la compra, dijo Kumar.
Nuevos riesgos
OpenAI planea eventualmente lanzar el modelo de IA detrás de Operator para que los desarrolladores puedan crear sus propios agentes.
Sin embargo, con estas capacidades también surgen nuevos riesgos de seguridad, ya que la IA puede cometer errores o ser mal utilizada. Es diferente que un chatbot proporcione una respuesta incorrecta sobre un evento histórico a que un agente cometa errores con la tarjeta de crédito de alguien.
OpenAI señaló que Operator está diseñado para rechazar ciertas tareas, como acciones relacionadas con la banca y cualquier cosa que la compañía considere dañina. Hay una serie de acciones que la herramienta no completará y, en su lugar, alertará al usuario para que las realice, como iniciar sesión en sitios web, proporcionar información de pago y completar CAPTCHA. Además, Operator debería pedir la aprobación del usuario antes de realizar acciones como hacer un pedido en línea. Para algunas tareas, como redactar correos electrónicos, el servicio requerirá supervisión del usuario, señaló OpenAI. Los usuarios también pueden tomar el control de cualquier tarea en proceso y pausarla si es necesario.
“El usuario siempre debe sentir que está en control”, afirmó Kumar.