Según reveló la compañía, la última actualización tiene mejoras significativas en pruebas para el modelo de lenguaje ya desarrollado por DeepSeek.
DeepSeek lanzó una actualización de su gran modelo de lenguaje esta semana, una actualización que según la compañía presentó “mejoras significativas” con respecto a su predecesor, ya que la startup con sede en China pareció intensificar su rivalidad con OpenAI y otras empresas de inteligencia artificial estadounidenses, después de que un lanzamiento anterior sacudiera las acciones tecnológicas mundiales.
DeepSeek lanzó el martes una actualización de su modelo de lenguaje grande V3, DeepSeek-V3-0324, en la plataforma de desarrollo de IA Hugging Face, que la startup comercializó como una actualización que incluye mejoras en las capacidades de razonamiento y codificación con respecto a su modelo V3 anterior.
El modelo de lenguaje grande V3 de DeepSeek se lanzó el 26 de diciembre de 2024, y la compañía afirmó que era tres veces más rápido que su modelo V2, ya que se ubicó entre los 10 mejores en Chatbot Arena, una plataforma de rendimiento alojada por la Universidad de California, Berkeley.
La última actualización incluyó “mejoras significativas” en varias pruebas comparativas para el modelo de lenguaje, dijo DeepSeek, además de actualizaciones en el desarrollo web frontend, competencia en escritura china (con nuevas características como “reescritura interactiva”, según la empresa) y capacidades de búsqueda en chino como “análisis de informes mejorado”.
Si el último modelo DeepSeek impacta las acciones tecnológicas estadounidenses. Las acciones de Nvidia cayeron un 1,2% a las 9:35 a. m. EDT, mientras que otras acciones como Broadcom (0,6%) y Tesla (0,3%) bajaron ligeramente. Apple (0,3%), Meta (0,7%) y Microsoft (0,3%) subieron el martes por la mañana.
DeepSeek es una startup de IA fundada por el emprendedor chino Liang Wenfeng en 2023. Liang comenzó a acumular miles de procesadores gráficos Nvidia para un proyecto de IA sin identificar en 2021, justo antes de que la administración Biden restringiera el comercio de esos chips a China. Instó a China a realizar una “transición gradual” para convertirse en un contribuyente a la industria de la IA, “en lugar de seguir aprovechando el éxito de otros”. DeepSeek afirma que sus productos son más eficientes y cuestan menos de entrenar y desarrollar en comparación con productos similares fabricados por OpenAI y Meta. La compañía afirmó que entrenar uno de sus últimos modelos costó alrededor de 5,6 millones de dólares, mucho menos que los entre 100 y 1000 millones de dólares que un ejecutivo de IA estimó para el costo de construir un modelo.
Un proyecto de ley bipartidista que prohíbe DeepSeek en dispositivos federales se presentó en febrero, después de que un informe vinculara al chatbot de la compañía con una empresa de telecomunicaciones estatal china prohibida. No está claro de inmediato si el proyecto de ley será apoyado por otros legisladores. La administración Trump también está considerando una prohibición por preocupaciones de seguridad nacional, dijo a Reuters una persona familiarizada con el asunto. Algunas agencias estadounidenses ya han restringido el acceso a DeepSeek, incluida la Marina de los EE. UU., el Departamento de Defensa, el Departamento de Comercio y la NASA, entre otros. Según se informa , el Director Administrativo de la Cámara afirmó que “los actores de amenazas ya están explotando DeepSeek para entregar software malicioso e infectar dispositivos”, ya que se ha advertido a algunas oficinas del Congreso que no usen DeepSeek.
DeepSeek lanzó su modelo de razonamiento avanzado R1 en enero, una medida que aparentemente puso a China en una competencia reñida con gigantes estadounidenses de la tecnología y la IA como OpenAI y Meta. R1 logró un rendimiento similar al del modelo o1 de OpenAI en varios puntos de referencia y, según se informa, lo superó en la prueba MATH-500. El modelo R1 de DeepSeek está disponible para que cualquiera pueda acceder, usar, estudiar, modificar y compartir, ya que el modelo de código abierto se disparó a la cima de las listas de descargas de iPhone, superando a ChatGPT de OpenAI. El lanzamiento de R1 provocó caídas en varias acciones tecnológicas estadounidenses, lideradas por Nvidia, que cerró con una caída del 17 % el 27 de enero. La caída de Nvidia redujo su capitalización bursátil en 589 000 millones de dólares, lo que marca la mayor pérdida de valor en un solo día para cualquier empresa que cotiza en bolsa en la historia. El director ejecutivo de OpenAI, Sam Altman, elogió los productos de DeepSeek y señaló que el modelo R1 era «impresionante… especialmente en lo que [DeepSeek].
Fuente: Forbes Chile