Liang Wenfeng, fundador de la aplicación de IA DeepSeek que ha desencadenado un terremoto en el sector tecnológico estadounidense con consecuencias en los mercados internacionales, es un empresario de 40 años que apuesta por el código abierto.
Su pequeña compañía fundada hace menos de dos años ha sorprendido al mundo esta semana al revelar la "receta" de un modelo de vanguardia de IA generativa con presupuesto limitado: este emprendedor chino y líder discreto y solitario se ha convertido en un héroe nacional que ha desafiado a Estados Unidos en su intento de frenar la competencia tecnológica de China y ha provocado un terremoto bursátil internacional.
Liang es también cofundador del fondo High-Flyer, principal patrocinador de DeepSeek, una de las siete principales empresas emergentes de China.
Liang nació en 1985 en la provincia de Cantón, donde su padre trabajaba como maestro de educación básica. Se mudó para estudiar ingeniería electrónica en la Universidad de Zhejiang, donde se especializó en visión artificial, y en 2010 obtuvo un máster en Ingeniería de la Información y Comunicaciones. Su tesis se tituló Investigación sobre el algoritmo de seguimiento de objetivos basado en una cámara PTZ de bajo costo.
Foto: Reuters
Con un grupo de compañeros de la facultad empezó a explorar las posibilidades de la IA para automatizar las inversiones en Bolsa con el objetivo de "encontrar una manera de automatizar precios". En 2013 lanzó Hangzhou Yakebi Investment y dos años más tarde, en 2015, se convierte en cofundador de High-Flyer Quant, un hedge fund cuántico basado en las matemáticas y la IA que se convirtió en poco tiempo en uno de los más grandes de China en capitalización.
El fondo multiplicó por más de 10 sus activos en cuatro años, pasando de 1.000 millones de yuanes (US$ 132 millones) en 2016 a más de 10.000 millones de yuanes (US$ 1.379 millones) en 2019, informa Efe con datos del hongkonés South China Morning Post.
En abril de 2023, High-Flyer Quant anunció en un comunicado la inversión de "un gran porcentaje" de sus beneficios a lo largo de los años para construir una "infraestructura líder a gran escala" en IA. Meses después lanzaba DeepSeek, que presentó una serie de modelos de IA utilizados por los desarrolladores para crear aplicaciones de terceros y por la start-up para crear su propio chatbot, explicaba un artículo de South China Morning Post.
Para ello Liang contrató a profesionales desconocidos, educados en China, sin un perfil concreto ni siempre con experiencia, "pero muy capaces y apasionados", según declaró Liang en una entrevista con 36Kr.
"Liang, personalmente implicado en la investigación de DeepSeek, utiliza los ingresos de sus operaciones en hedge funds para pagar los mejores salarios a los mejores talentos de IA. Junto con ByteDance, propietario de TikTok, DeepSeek es conocido por pagar los mejores sueldos a los ingenieros de IA en China. Sus empleados trabajan desde oficinas ubicadas en Hangzhou y Pekín", informa Financial Times (FT).
"Las oficinas de DeepSeek parecen un campus universitario para investigadores serios, un equipo que comparte la visión de Liang: mostrarle al mundo que los chinos pueden ser creativos y construir algo desde cero", explicó un socio comercial.
El propio Liang ha calificado a DeepSeek como una empresa exclusivamente "nacional", formada por doctores de las mejores universidades chinas, las de Pekín, Tsinghua y Beihang, y no por expertos de empresas estadounidenses. Su equipo central "no tenía gente que regresase del extranjero. Todos son locales (...) Tenemos que apostar nosotros mismos por nuestros mejores talentos".
El hecho de que Liang fuera una persona ajena al campo de la IA ha sorprendido. "En High-Flyer amasó una fortuna usando IA y algoritmos para detectar patrones que pudieran afectar los precios de las acciones. Su equipo se especializó en utilizar los chips de Nvidia para ganar dinero negociando acciones".
Antes de que Estados Unidos impusiera restricciones a la venta de chips a China, Liang comenzó a comprar miles de unidades de procesamiento gráfico de Nvidia mientras dirigía su fondo de trading cuantitativo High-Flyer: miles de procesadores Nvidia H800 para entrenar modelos avanzados de inteligencia artificial.
Los expertos en IA lo consideraron parte de la actitud excéntrica de un multimillonario que se entretenía con un nuevo pasatiempo.
Pero DeepSeek se ha mostrado como un importante desarrollador de modelos de lenguaje de gran tamaño (LLM) de escaso presupuesto limitado que funciona con chips de menor coste y menos datos que los modelos desarrollados en EEUU.
Tras el lanzamiento en diciembre de su modelo DeepSeek-V3, desarrollado en dos meses y con un costo inferior a US$ 6 millones, el 20 de enero de 2025 lanza el DeepSeek-R1, con un rendimiento similar al de últimos modelos de OpenAI en tareas como matemáticas, razonamiento del lenguaje y codificación con una inversión mucho menor para su entrenamiento.
Héroe nacional
La identidad de DeepSeek como una empresa totalmente china le ha valido elogios en su país. Las autoridades al máximo nivel siguen de cerca el fenómeno DeepSeek y su fundador se ha convertido en emblema del progreso en China y orgullo nacional.
La semana pasada el Gobierno reconoció su proyección concediéndole el gran honor de invitarle a un simposio en Pekín junto al primer ministro, Li Qiang, con un grupo de expertos de sectores como tecnología, educación, ciencia, cultura, salud y deportes y siendo Liang el único experto en IA. Qiang pidió en ese evento a los empresarios asistentes "centrar esfuerzos para avanzar en las tecnologías clave".
Marc Andreessen, asesor de Trump y uno de los inversores de capital riesgo más influyentes en Silicon Valley, decía esta semana que Deepseek R1 "es uno de los avances más sorprendentes e impresionantes que he visto jamás y, como código abierto, un gran regalo para el mundo". "Deepseek R1 es el momento Sputnik de la IA".
Los expertos de la industria sostienen en FT que, aunque DeepSeek ha tenido resultados inesperados con recursos limitados, la incógnita es "si puede seguir siendo competitivo a medida que la industria evoluciona".
Sus rivales estadounidenses no se han quedado de brazos cruzados y están creando mega "clusters" de chips Blackwell de próxima generación de Nvidia, creando la potencia informática que amenaza con volver a marcar la diferencia con respecto a sus rivales chinos, apunta FT.
Esta semana, OpenAI anunció también que estaba creando un joint venture con SoftBank de Japón llamado Stargate en el que planea invertir al menos US$ 100.000 millones en infraestructura de IA en Estados Unidos. xAI de Elon Musk, por su parte, está ampliando su supercomputadora Colossus para contener más de 1 millón de GPU para ayudar a entrenar sus modelos de IA Grok.
"DeepSeek tiene uno de los clusters de computación avanzada más grandes de China. Tienen suficiente capacidad por ahora, pero no por mucho más tiempo", reconoció el socio comercial de Liang.