El modelo más reciente de la firma asiática, DeepSeek-R1, está en la mira de los especialistas en tecnología e IA. Estos son los motivos.
La compañía con sede en China especializada en inteligencia artificial (IA), DeepSeek, está posicionándose cada vez más en la mira de los especialistas occidentales.
El lunes 27 de enero, se reportó que Nvidia sufrió la mayor pérdida de valor bursátil diaria, a raíz de la irrupción de la compañía asiática.
Se afirma que, en apenas un día, perdió cinco veces lo que vale el conjunto de empresas IPSA, que son las más importantes de Chile que cotizan en la bolsa local.
Especialistas explicaron al Wall Street Journalque DeepSeek casi ha igualado a sus rivales de Estados Unidos.
Aquello, a pesar de que utilizan chips menos avanzados.
Actualmente, son dos los modelos más destacados de la firma: el V3 y el R1, el más reciente.
Cómo es DeepSeek-R1, la Inteligencia Artificial de China que impresiona a los expertos del mundo
DeepSeek-R1 es un modelo de IA de la empresa china DeepSeek, el cual se presenta como una alternativa más económica de desarrollar en comparación a otros algoritmos con capacidades avanzadas de razonamiento, como OpenAI o1, según rescata Wired.
Un análisis publicado en Nature asegura que tiene un rendimiento similar al demostrado por el sistema más avanzado de la compañía dirigida por Sam Altman, al resolver problemas matemáticos, químicos y de codificación.
Según Wired, el modelo alcanza una precisión del 97% en la resolución de los desafíos de matemáticas, evaluados con el parámetro MATH-500.
También supera al 96% de los participantes humanos en las pruebas de programación de la iniciativa Codeforces.
Respecto a cómo funciona, se detalla que procesa solicitudes a través de “cadenas de pensamiento”, que emulan los procesos de razonamiento humano.
Dicho mecanismo, a grandes rasgos, es similar al de otros sistemas desarrollados en Estados Unidos.
DeepSeek-R1 fue entrenado con base en el funcionamiento del chatbot V3, que también es de la firma china.
Para ello, se utilizaron técnicas de aprendizaje de refuerzo, en los que recompensaron al sistema por llegar a una respuesta acertada y por describir su “pensamiento” en los procesos de resolución.
Las informaciones reunidas por el citado medio afirman que los investigadores también usaron una arquitectura de “mezcla de expertos”, la cual permite al modelo decidir qué redes de procesamiento debe activar para realizar cada tarea.
Según rescata CNN, DeepSeek dijo que había gastado 5,6 millones de dólares en impulsar su modelo básico de IA.
A modo de comparación, según Wired, el uso de su modelo R1 cuesta una trigésima parte de lo que implica utilizar OpenAI o1.
El director del Laboratorio de Ciencias Artificiales del Instituto Max Planck, Mario Krenn, dijo en declaraciones reunidas por el citado medio que “un experimento que costaba más de 300 libras con OpenAI o1, ahora puede hacerse por menos de 10 dólares”.
“Esta es una diferencia drástica que influirá en la futura adopción (del algoritmo chino)”, comentó.
El modelo más reciente de DeepSeek se publicó como una herramienta “open-weight”, bajo una licencia del Instituto Tecnológico de Massachusetts.
Lo anterior implica, según explicaron expertos a Wired, que sus cadenas de pensamiento son accesibles para los investigadores y el modelo puede reutilizarse sin restricciones.
Sin embargo, aquello no se traduce en que sea completamente de código abierto, ya que sus datos de entrenamiento no están disponibles.
El vicepresidente global de HTC, Alvin Wang Graylin, enfatizó al citado medio que “la ventaja que Estados Unidos alguna vez percibió tener se ha reducido”.
Y sugirió: “Ambas naciones deben adoptar un enfoque colaborativo para desarrollar una IA avanzada, en lugar de perpetuar la actual competencia estéril de carrera armamentista”.
Fuente: La Tercera