OpenAI asegura haber encontrado pruebas de que DeepSeek, una startup china de inteligencia artificial, utilizó los modelos de la compañía estadounidense para entrenar su propio competidor de código abierto, lo que aumenta la preocupación por una posible violación de la propiedad intelectual.
La empresa con sede en San Francisco, creadora de ChatGPT, dijo al Financial Times que ha visto indicios de “destilación”, técnica que sospecha que proviene de DeepSeek. La destilación es un método que utilizan los desarrolladores para obtener un mejor rendimiento en modelos más pequeños empleando resultados de modelos más grandes y capaces, lo que permite lograr resultados similares para tareas específicas a un costo mucho menor.
La destilación es una práctica habitual en la industria, pero la preocupación radica en que DeepSeek podría estar usándola para crear su propio modelo competidor, lo cual violaría los términos de servicio de OpenAI.
“El problema surge cuando (sacas los resultados de la plataforma y) lo haces para crear tu propio modelo con tus propios fines”, dijo una persona cercana a OpenAI.
OpenAI se negó a comentar más al respecto o a proporcionar detalles sobre las pruebas. Sus términos de servicio establecen que los usuarios no pueden “copiar” ninguno de sus servicios ni “usar el output para desarrollar modelos que compitan con OpenAI”.
El lanzamiento del modelo de razonamiento R1 de DeepSeek ha sorprendido a los mercados, así como a inversionistas y empresas tecnológicas en Silicon Valley. Sus modelos, desarrollados con recursos mínimos, han alcanzado altos puntajes y resultados comparables a los principales modelos estadounidenses.
Las acciones de Nvidia cayeron un 17% el lunes, lo que redujo en US$ 589.000 millones su valor de mercado, ante los temores de que las grandes inversiones en su costoso hardware de IA podrían no ser necesarias. Se recuperaron un 9% el martes, al igual que otras acciones tecnológicas.
OpenAI y su socio Microsoft investigaron el año pasado las cuentas que se creía pertenecían a DeepSeek, las cuales usaban la API (interfaz de programación de aplicaciones) de OpenAI, y les bloquearon el acceso por sospechas de destilación que violaba los términos de servicio, según otra persona con conocimiento directo. Estas investigaciones fueron reportadas inicialmente por Bloomberg.
Microsoft se negó a comentar y OpenAI no respondió de inmediato a una solicitud de comentarios sobre este detalle. DeepSeek no respondió a una solicitud de comentarios durante las vacaciones del Año Nuevo Lunar.
Más temprano, David Sacks —zar de IA y criptomonedas del presidente Donald Trump— dijo que “es posible” que haya ocurrido un robo de propiedad intelectual.
“Hay una técnica en IA llamada destilación… cuando un modelo aprende de otro modelo (y) extrae el conocimiento del modelo padre”, dijo Sacks a Fox News el martes.
“Y hay evidencia sustancial de que lo que DeepSeek hizo aquí fue destilar el conocimiento de los modelos de OpenAI, y no creo que OpenAI esté muy contenta con esto”, agregó Sacks, sin aportar pruebas.
DeepSeek afirmó que utilizó solo 2.048 tarjetas gráficas Nvidia H800 y gastó US$ 5.6 millones para entrenar su modelo V3 con 671.000 millones de parámetros, una fracción de lo que OpenAI y Google habrían invertido para entrenar modelos de tamaño comparable. Algunos expertos sostienen que las respuestas generadas por el modelo indican que fue entrenado con los outputs de GPT-4 de OpenAI, lo cual violaría sus términos de servicio.
Quienes conocen la industria señalan que es común que laboratorios de IA tanto en China como en Estados Unidos utilicen los resultados de compañías como OpenAI, que han invertido en contratar personas para enseñar a sus modelos a producir respuestas más humanas. Esto exige muchos recursos y trabajo, y los actores más pequeños a menudo se aprovechan de este esfuerzo, según estos expertos.
“Es muy común que startups y académicos utilicen los resultados de LLM comerciales alineados con humanos, como ChatGPT, para entrenar otro modelo”, explica Ritwik Gupta, estudiante de doctorado en IA en la Universidad de California, Berkeley.
“Eso significa que obtienes gratis esa etapa de retroalimentación humana. No me sorprende que DeepSeek supuestamente esté haciendo lo mismo. Si lo hacen, quizá sea difícil detener esta práctica de manera precisa”, añadió.
La práctica pone en evidencia la dificultad que enfrentan las empresas que buscan proteger su ventaja técnica. “Sabemos que las compañías con sede en (China), y otras, están intentando constantemente destilar los modelos de las principales empresas estadounidenses de IA”, señaló OpenAI en su declaración más reciente.
Agregó: “Tomamos contramedidas para proteger nuestra propiedad intelectual, que incluyen un proceso cuidadoso para decidir qué capacidades punteras incluimos en los modelos que lanzamos. Y creemos… que es de importancia crítica trabajar estrechamente con el gobierno de EEUU para proteger los modelos más capaces de los esfuerzos de adversarios y competidores que buscan apropiarse de la tecnología estadounidense”.
OpenAI enfrenta sus propias acusaciones de violación de derechos de autor por parte de periódicos y creadores de contenido, incluidas demandas de The New York Times y autores reconocidos, quienes acusan a la compañía de haber entrenado sus modelos con artículos y libros sin permiso.