Anthropic ha presentado su nueva familia de modelos de Inteligencia Artificial (IA) Claude 3, que supera a otros modelos del sector, como GPT-4, "en la mayoría de puntos de referencia" con su versión más potente llamada Opus, destacando por sus habilidades "casi humanas" de comprensión y fluidez en tareas complejas.
La compañía ha dado a conocer su nueva familia de modelos compuesta por Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus -en orden ascendente según su capacidad-, que ofrecen un rendimiento cada vez más potente para ajustarse a las necesidades de los usuarios, con el objetivo de conseguir un equilibrio óptimo entre inteligencia, velocidad y precio.
En concreto, los modelos de Claude 3 pueden mantener conversaciones con los clientes, así como autocompletar texto y llevar a cabo tareas de extracción de datos, asegurando "respuestas inmediatas y en tiempo real". Igualmente, se trata de una familia de modelos multimodales, ya que permiten procesar una amplia gama de formatos visuales, como son las fotografías, cuadros, gráficos y diagramas técnicos.
En cuanto a su ventana de contexto, los modelos Claude 3 disponen inicialmente de 200.000 tokens en el momento del lanzamiento, aunque son capaces de aceptar entradas superiores a un millón de tokens.
Así, con esta nueva familia de modelos, Anthropic ha detallado que también ha conseguido ofrecer mejoras relacionadas con mayores capacidades de análisis y pronóstico, así como más progreso en la creación de contenido, en la generación de código y en las conversaciones con idiomas distintos al inglés, como es el caso del español, japonés y francés.
Haiku, sonnet y opus
La compañía define el modelo Haiku como el "más rápido y rentable del mercado" en su categoría de inteligencia. Tanto es así que con sus capacidades, Haiku puede leer un artículo de investigación en el que se incluyen datos e información equivalentes a 10.000 tokens, con cuadros y gráficos, "en menos de tres segundos".
Por su parte, Claude 3 Sonnet está pensado para tareas con gran carga de trabajo. Tal y como ha puntualizado Anthropic, se trata de un modelo dos veces más rápido que Claude 2 y Claude 2.1, además de disponer de niveles más altos de inteligencia. En este sentido, Sonnet destaca en tareas que requieren respuestas rápidas, como a la hora de recuperar información, datos o algún tipo de conocimiento.
Respecto a Claude 3 Opus, se trata del modelo más inteligente que ha presentado la compañía, de hecho, al contrario que Sonnet, ofrece velocidades similares a las de los modelos anteriores Claude 2 y 2.1, sin embargo, dispone de niveles de inteligencia "mucho más altos".
De hecho, tal y como ha subrayado en un comunicado en su web, se trata de un modelo que supera a otros similares de la competencia "en la mayoría de los puntos de referencia de evaluación comunes para sistemas de IA".
Estos puntos de referencia se basan en el conocimiento experto a nivel de pregrado (MMLU), el razonamiento experto a nivel de posgrado (GPQA) y las matemáticas básicas (GSM8K), entre otras cuestiones. Con ello, la tecnológica ha señalado que Opus es capaz de alcanzar niveles "casi humanos" de comprensión y fluidez en tareas complejas.
Según ha mostrado Anthropic en una tabla con los resultados de los puntos de referencia de evaluación, en la que compara los modelos de la familia Claude 3 con modelos de otras compañías. Opus supera al modelo GPT-4, desarrollado por OpenAI, en todos los resultados.
Por ejemplo, en el razonamiento experto a nivel de posgrado (GPQA), Opus obtiene una puntuación un 14,7 por ciento más alta (50,4 por ciento) que en el caso de GPT-4 (35,7 por ciento). Igual ocurre con los resultados de matemáticas básicas con un 95 por ciento de Opus, frente a un 92 por ciento de GPT-4, y con el conocimiento MMLU (86,8 y 86,4 por ciento, respectivamente).
Mejor comprensión contextual y más precisión
Además de todo ello, Anthropic también ha detallado que los modelos de Claude 3 también han mejorado su comprensión contextual, por lo que tienen muchas menos probabilidades de negarse a responder algunas indicaciones de los usuarios.
Es decir, los nuevos modelos muestran una comprensión "más matizada" de las solicitudes. Así, son capaces de reconocer el daño real y, por tanto, las negativas para responder indicaciones "inofensivas" son mucho menos frecuentes.
Por otra parte, Anthropic ha destacado la necesidad de que los resultados de sus modelos "mantengan una alta precisión a escala", para ello, ha explicado que los utilizan un conjunto de preguntas fácticas complejas, relacionadas con las debilidades conocidas de los modelos actuales.
En base a estas preguntas, se clasifican las respuestas en correctas, incorrectas y "admisiones de incertidumbre". De esta forma, en caso de incertidumbre, el modelo responde que no sabe la respuesta, en lugar de proporcionar información incorrecta. Gracias a este sistema, el modelo Opus ofrece una precisión en sus respuestas el doble de mejor que Claude 2.1.
Además, la compañía también ha detallado que "pronto" habilitarán citas en las respuestas de los modelos de Claude 3, para ofrecer frases precisas con la información y las fuentes de referencia. Con ello, los usuarios podrán verificar dichas respuestas.
Responsabilidad
Finalmente, Anthropic ha resaltado que la familia de modelos Claude 3 han sido ideados para que sean "tan confiables como sea posible", para ello, cuentan con equipos dedicados en identificar y mitigar riesgos, como ofrecer información falsa o la habilidad de replicación autónoma.
Asimismo, asegura haber mejorado la seguridad y transparencia de los modelos, además de haber ajustado esta tecnología para mitigar los problemas de privacidad. Igualmente, Claude 3 muestra menos sesgos que los modelos anteriores, promoviendo una mayor neutralidad y que no estén inclinados hacia "ninguna postura partidista en particular".
En concreto, a pesar de haber avanzado en diversos aspectos con respecto a las versiones de IA anteriores, la familia de modelos Claude 3 se mantiene en el nivel de seguridad de IA (ASL-2), según la política de escalamiento responsable de Anthropic.
Con todo ello, Anthropic ha detallado que los modelos Opus y Sonnet están disponibles a través de la API de Claude para desarrolladores. Asimismo, Sonnet impulsa la experiencia gratuita de claude.ai y Opus también está disponible para los suscriptores de Claude Pro.
Además, Sonnet también se puede encontrar en Amazon Bedrock y en vista previa privada en Vertex AI Model Garden de Google Cloud. Respecto al modelo Haiku, la compañía ha indicado que estará disponible "pronto".