Claude 3.5 Sonnet de Anthropic puede competir con los mejores modelos de IA del mercado, y la compañía se diferencia de rivales como OpenAI al presentarse como una empresa de IA que prioriza la seguridad.
El último modelo de inteligencia artificial generativa de la empresa Anthropic, Claude 3.5 Sonnet, ya está obteniendo buenos resultados frente a rivales líderes como GPT-4o de OpenAI en evaluaciones clave de IA, solo días después de su lanzamiento. Este es el último avance en la carrera de las empresas por desarrollar modelos de IA más grandes y mejores y capitalizar la última fiebre del oro tecnológico.
HECHOS CLAVE:
- Anthropic lanzó Claude 3.5 Sonnet el pasado jueves, presumiendo de ser “nuestro modelo más inteligente hasta la fecha” y capaz de superar a competidores como Llama de Meta y Gemini de Google en “evaluaciones clave” como razonamiento y codificación, funcionando al doble de velocidad y a un quinto del costo de su modelo anterior, Claude 3 Opus.
- Anthropic presenta Sonnet como el “hijo del medio trabajador” para “tareas eficientes y de alto rendimiento” dentro de su familia de tres modelos de IA Claude, combinando aspectos de su modelo rápido Haiku y su modelo “poderoso” Opus diseñado para tareas altamente complejas.
- Los modelos impulsan el chatbot Claude de Anthropic, un rival del popular ChatGPT de OpenAI que está disponible tanto en versión gratuita como en una versión “pro” de pago.
- A solo días de su lanzamiento, Claude 3.5 Sonnet ya ha escalado a la cima de varias tablas de clasificación en la LMSYS Chatbot Arena, un importante sitio de evaluación colaborativa para modelos de lenguaje grande, y superó con creces a su hermano mayor Claude 3 Opus de Anthropic.
- En una publicación en X, anteriormente Twitter, la cuenta de LMSYS dijo que Claude 3.5 Sonnet había dado “un gran salto”, asegurando el primer lugar en codificación y tareas difíciles, aunque se ubicó en segundo lugar en la clasificación general de LMSYS que evalúa el rango completo de funciones de IA, detrás del recién lanzado modelo GPT-4o de OpenAI.
- Para la mayoría de las personas que utilizan la herramienta de IA para tareas cotidianas, la diferencia en el rendimiento probablemente sea tan leve que sea imperceptible, y la cuenta de LMSYS destacó que Claude 3.5 Sonnet estaba a la altura de los mejores y era “competitivo… en todos los aspectos” con modelos líderes como GPT-4o y Gemini 1.5 Pro.
¿QUÉ ES ANTHROPIC?
Anthropic es una empresa de IA estadounidense y un actor clave en el panorama de la IA generativa. Se presenta como una empresa centrada en la seguridad que prioriza el desarrollo seguro y responsable de la inteligencia artificial sobre la comercialización y las ganancias. Anthropic fue fundada en 2021 por un grupo de investigadores que desertaron del líder de la industria OpenAI debido a preocupaciones de que la empresa se preocupaba más por ganar dinero que por la seguridad. Este grupo incluía a los hermanos y ex ejecutivos de OpenAI, Dario Amodei y Daniela Amodei, quienes respectivamente lideran la empresa hoy como CEO y presidenta. Ha asegurado financiamiento por un total de 8.360 millones de dólares, incluyendo acuerdos importantes con gigantes como Amazon y Google, y tiene una valoración post-dinero de 18.400 millones de dólares después de una nueva ronda de financiamiento, según datos de Pitchbook.
QUÉ OBSERVAR:
Anthropic dijo que Claude 3.5 Sonnet es “nuestro primer lanzamiento de la próxima familia de modelos Claude 3.5”. La empresa de IA mencionó que planea lanzar Claude 3.5 Haiku y Claude 3.5 Opus “más adelante este año”, aunque no especificó una fecha o un marco de tiempo aproximado. Basándose en las capacidades de la familia Claude, se puede esperar que Haiku sea el menos potente pero el más rápido del trío, y Opus el modelo de IA Claude más potente dentro del conjunto de Anthropic. La compañía dijo que su “objetivo es mejorar sustancialmente la curva de compensación entre inteligencia, velocidad y costo cada pocos meses”, y agregó que está desarrollando nuevas modalidades y características para apoyar a las empresas y aplicaciones empresariales además de desarrollar los modelos de próxima generación.
Fuente: Forbes Chile