El Mercurio Web | Noticias, Información y Análisis

View Original

DeepSeek se apresura a lanzar un nuevo modelo de IA mientras China apuesta todo

La empresa afirma que espera que el nuevo modelo produzca una mejor codificación y sea capaz de razonar en idiomas distintos del inglés

Con información de Reuters

PEKÍN/HONG KONG/SINGAPUR, 25 feb (Reuters) - DeepSeek busca aprovechar su ventaja. La startup china desencadenó una liquidación de más de un billón de dólares en los mercados de valores mundiales el mes pasado con un modelo de razonamiento de inteligencia artificial a precio reducido que superó a muchos competidores occidentales.

Ahora, la firma con sede en Hangzhou está acelerando el lanzamiento del sucesor del modelo R1 de enero, según tres personas familiarizadas con la compañía.

Deepseek había planeado lanzar R2 a principios de mayo, pero ahora quiere que salga lo antes posible, dijeron dos de ellos, sin proporcionar detalles.

La empresa afirma que espera que el nuevo modelo produzca una mejor codificación y sea capaz de razonar en idiomas distintos del inglés. Los detalles del cronograma acelerado para el lanzamiento de R2 no se han informado previamente.

DeepSeek no respondió a una solicitud de comentarios para esta historia.

Los rivales aún están digiriendo las implicaciones del R1, que fue construido con chips Nvidia menos potentes pero es competitivo con aquellos desarrollados a un costo de cientos de miles de millones de dólares por gigantes tecnológicos estadounidenses.

"El lanzamiento del modelo R2 de DeepSeek podría ser un momento decisivo en la industria de la IA", afirmó Vijayasimha Alilughatta, director de operaciones del proveedor indio de servicios tecnológicos Zensar. El éxito de DeepSeek en la creación de modelos de IA rentables "probablemente impulsaría a las empresas de todo el mundo a acelerar sus propios esfuerzos... rompiendo el dominio de los pocos actores dominantes en el campo", afirmó.

Es probable que R2 preocupe al gobierno de Estados Unidos, que ha identificado el liderazgo en inteligencia artificial como una prioridad nacional. Su lanzamiento puede galvanizar aún más a las autoridades y empresas chinas, docenas de las cuales dicen que han comenzado a integrar modelos DeepSeek en sus productos.

Se sabe poco sobre DeepSeek, cuyo fundador, Liang Wenfeng, se convirtió en multimillonario gracias a su fondo de cobertura cuantitativo High-Flyer. Liang, a quien un ex empleador describió como "discreto e introvertido", no ha hablado con ningún medio desde julio de 2024.

Reuters entrevistó a una docena de ex empleados, así como a profesionales de fondos cuantitativos con conocimiento de las operaciones de DeepSeek y su empresa matriz High-Flyer. También revisó artículos de medios estatales, publicaciones en redes sociales de las empresas y documentos de investigación que se remontan a 2019.

Contaron la historia de una empresa que funcionaba más como un laboratorio de investigación que como una empresa con fines de lucro y que no estaba sujeta a las tradiciones jerárquicas de la industria tecnológica de alta presión de China, incluso cuando se convirtió en responsable de lo que muchos inversores ven como el último avance en IA.

CAMINO DIFERENTE

Liang nació en 1985 en un pueblo rural de la provincia meridional de Guangdong. Posteriormente obtuvo el título de ingeniero de comunicaciones en la prestigiosa Universidad de Zhejiang.

Uno de sus primeros empleos fue dirigir un departamento de investigación en una empresa de imágenes inteligentes en Shanghái. Su entonces jefe, Zhou Chaoen, dijo a los medios estatales el 9 de febrero que Liang había contratado a ingenieros de algoritmos galardonados y operaba con un "estilo de gestión plano".

En DeepSeek y High-Flyer, Liang también ha rechazado las prácticas de los gigantes tecnológicos chinos conocidos por su gestión rígida de arriba hacia abajo, los bajos salarios para los empleados jóvenes y el "996" (trabajar de 9 a 21 horas seis días a la semana).