El director ejecutivo de OpenAI, Sam Altman, aseguró que acelerará el lanzamiento de productos y “entregará modelos mucho mejores” después de que los avances de la startup china DeepSeek debilitaran el liderazgo de Silicon Valley en la carrera global por la inteligencia artificial (IA).
El chatbot de IA generativa de DeepSeek, un rival directo de ChatGPT, puede realizar ciertas tareas al mismo nivel que los modelos más recientes de OpenAI, Anthropic y Meta, a pesar de haber sido desarrollado con una fracción del dinero y del tiempo.
El lanzamiento del modelo R1 de DeepSeek la semana pasada, junto con su ascenso al primer lugar en la App Store de Apple, provocó una venta masiva de acciones tecnológicas. Las acciones asiáticas cayeron el martes tras una debacle en Wall Street durante la noche anterior.
El Nasdaq cayó un 3%, mientras que el fabricante de chips Nvidia, que produce los procesadores utilizados para entrenar grandes modelos de IA, bajó un 17%, perdiendo US$ 600 mil millones en capitalización de mercado.
El lunes por la noche, Altman escribió en X que el modelo de DeepSeek era “impresionante, especialmente por lo que logran entregar por ese precio”. Agregó: “Obviamente, entregaremos modelos mucho mejores, y también es legítimamente estimulante tener un nuevo competidor”.
Altman, quien la semana pasada anunció que inversionistas, incluido SoftBank, gastarían hasta US$ 500 mil millones para construir una red de centros de datos que respalden sus modelos de IA, añadió que los recursos informáticos son “más importantes ahora que nunca”.
Microsoft, Meta, Alphabet, Amazon y Oracle han destinado US$ 310 mil millones en 2025 para gastos de capital, incluidos los relacionados con infraestructura de IA, según datos recopilados por Visible Alpha. Estas estimaciones parten de la premisa de que se necesitará una gran cantidad de poder computacional para avanzar en las capacidades de la IA.
Sin embargo, la capacidad de DeepSeek para competir con un presupuesto ínfimo en comparación con OpenAI —valorada recientemente en US$ 157 mil millones— y con rivales como Anthropic, Google y Meta, ha puesto en duda las enormes sumas invertidas en entrenar sistemas de IA.
“Los ganadores no serán quienes quemen más dinero”, afirmó Aidan Gomez, fundador de Cohere, con sede en Toronto, que desarrolla grandes modelos de lenguaje para empresas. En cambio, señaló, serán quienes “encuentren soluciones eficientes”.
El lunes, el presidente de EEUU Donald Trump calificó el último lanzamiento de DeepSeek como “un llamado de atención para nuestras industrias: necesitamos estar absolutamente enfocados en competir para ganar”. Trump añadió que quería “liberar” a las empresas tecnológicas estadounidenses y “dominar el futuro como nunca antes”.
Impacto de DeepSeek
Sin embargo, los avances de DeepSeek han expuesto riesgos para los capitalistas de riesgo, quienes invirtieron casi US$ 100 mil millones en startups de IA en EEUU el año pasado. “Ahora hay un modelo abierto flotando por internet que puedes usar para convertir cualquier modelo base suficientemente potente en un razonador de IA”, escribió Jack Clark, cofundador de Anthropic, en un blog el lunes.
“Las capacidades de la IA a nivel mundial han avanzado de forma irreversible”, añadió. “Mis felicitaciones a DeepSeek por atreverse a traer un cambio tan significativo al mundo”.
El éxito de DeepSeek ha complicado la narrativa de que enormes inversiones crean ventajas insuperables, algo que ha ayudado a los principales laboratorios de Silicon Valley a recaudar US$ decenas de miles de millones en el último año.
“Si eres Anthropic u OpenAI y alguien puede ofrecer lo mismo que tú por una décima parte del costo, eso es problemático”, dijo Mike Volpi, quien lideró la inversión de Index Ventures en Cohere.
El lanzamiento repentino del último modelo de DeepSeek tomó por sorpresa a algunos en Meta. “La principal frustración es: ‘¿Por qué no se nos ocurrió esto primero?’ cuando tenemos a miles de las mentes más brillantes trabajando en esto”, comentó un empleado de Meta.
El director ejecutivo, Mark Zuckerberg, quien la semana pasada anunció que planeaba destinar hasta US$ 65 mil millones a expandir equipos de IA y construir un nuevo centro de datos, ha abogado por el uso de modelos de código abierto, posicionando a Meta como líder en EEUU. “Queremos que EEUU establezca el estándar global de la IA, no China”, dijo la empresa en respuesta a DeepSeek.
Yann LeCun, científico jefe de IA en Meta, afirmó que “ofrecer servicios de asistente de IA para miles de millones” aún requeriría grandes cantidades de poder computacional.
Algunos inversionistas y competidores han expresado escepticismo sobre los bajos costos citados por DeepSeek para desarrollar sus modelos. En diciembre, la empresa afirmó que su modelo V3, en el que se basa el chatbot de su app, costó solo US$ 5,6 millones para entrenar.
Sin embargo, aclaró que esta cifra corresponde solo al entrenamiento final, no al ciclo completo, y excluye “los costos asociados con investigaciones previas y experimentos sobre arquitecturas, algoritmos o datos”.
Hacia el futuro
DeepSeek atribuye su éxito, a pesar de utilizar chips inferiores a los de sus competidores en EEUU, a métodos que permiten que el modelo de IA se enfoque selectivamente en partes específicas de los datos de entrada, reduciendo así los costos.
Para su último modelo R1, usó una técnica de aprendizaje por refuerzo, un enfoque relativamente nuevo en IA en el que los modelos aprenden a mejorar sin supervisión humana. También utilizó modelos de código abierto, como Qwen de Alibaba y Llama de Meta, para ajustar su modelo R1.
Los avances técnicos y el interés de los inversionistas en DeepSeek podrían acelerar a las empresas de IA. “En general, esperamos que el sesgo esté hacia una mayor capacidad, avanzando rápidamente hacia una inteligencia artificial general, más que hacia una reducción de gastos”, afirmó la firma de investigación Rosenblatt el lunes.
Investigadores e inversores, incluido Marc Andreessen, han comparado la carrera entre EEUU y China por la inteligencia artificial general (AGI, su sigla en inglés) con su competencia con la Unión Soviética durante la Guerra Fría, tanto en la exploración espacial como en el desarrollo de armas nucleares.
Stuart Russell, profesor de ciencias de la computación en la Universidad de California, Berkeley, afirmó que la carrera hacia la AGI es “peor”.
“Incluso los directores ejecutivos involucrados en esta carrera han admitido que quien gane tiene una probabilidad significativa de causar la extinción humana en el proceso, porque no tenemos idea de cómo controlar sistemas más inteligentes que nosotros”, dijo. “En otras palabras, la carrera hacia la AGI es una carrera hacia el borde de un precipicio”.