Así es Nova, el competidor de ChatGPT de Amazon, con herramientas de creación de imágenes y video

Andy Jassy, CEO de Amazon, anunció nuevos modelos de IA que serán parte de la librería de Amazon Bedrock en AWS

4 de diciembre de 2024
21:42
4 minutos de lectura'

LA NACION

Amazon Nova tendrá cuatro modelos de texto, además de Canvas para fotos y Reel para video

LAS VEGAS.- Amazon anunció una serie de modelos de IA bajo el nombre Nova, que compiten con ChatGPT y Gemini, y estarán disponibles dentro de la librería de Amazon Bedrock en AWS para todos los usuarios del servicio. El anuncio vino de la mano del Presidente y CEO de la compañía, Andy Jassy, en el evento AWS: reInvent 2024, que está tomando lugar del 2 al 6 de diciembre en Las Vegas, Nevada, Estados Unidos.

Se anunciaron cuatro modelos multimodales (que pueden procesar distintos tipos de archivo, no solo texto, por parte del usuario), además de uno para crear imágenes y otro para crear videos. Además, contarán con una función “voz a voz” (el usuario le habla a la IA, y esta le contesta hablando). “Nova brindará inteligencia de vanguardia y una relación precio-rendimiento líder en la industria”, afirmó Jassy en su conferencia en AWS: reInvent del martes 3 de diciembre.

Cuatro de estos modelos ya están disponibles, y dos se lanzarán en el primer trimestre de 2025.

“En Amazon, tenemos cerca de 1,000 aplicaciones de IA generativa en funcionamiento y hemos tenido una visión general de lo que los desarrolladores de aplicaciones aún están afrontando”, afirmó Rohit Prasad, vicepresidente de Inteligencia Artificial General de Amazon. “Nuestros nuevos modelos Amazon Nova están pensados para ayudar a los desarrolladores internos y externos a afrontar estos desafíos, y proporcionar una inteligencia y una generación de contenido convincentes”.

AWS re:Invent 2024
Photo by Noah Berger — AWS re:Invent 2024 Photo by Noah BergerNoah Berger

Un ejemplo de cómo funciona Amazon Nova

Los distintos modelos de IA que tendrá Amazon Nova

Amazon Nova Micro: un modelo solo de texto, bien rápido, que brinda respuestas rápidas y con bajo costo. Para soluciones rápidas y no tan complejas, y que sean solo de texto. Ya disponible.

Amazon Nova Lite: un modelo multimodal de bajo costo, puede procesar imágenes, videos y texto y responde rápido. Ya disponible.

Amazon Nova Pro: un modelo multimodal más avanzado, no tan rápido pero capaz de procesar tareas mucho más complejas. Ya disponible.

Amazon Nova Premier: el modelo multimodal más capacitado, capacitado para resolver tareas que requieran razonamiento avanzado. Se lanzará en el primer trimestre de 2025

Amazon Nova Canvas: para generar imágenes a partir de un prompt (instrucciones) de texto. Se le pueden especificar distintos estilos de arte, o mismo proporcionarle una imagen y pedirle que copie el estilo de esa imagen. También proporciona funciones que facilitan la edición de imágenes mediante entradas de texto y proporciona controles para ajustar el esquema de colores y el diseño. Ya disponible

Amazon Nova Reel: para generar videos a partir de un prompt de texto. Se lanzará también en el primer trimestre de 2025. Servirá para la creación de contenido en publicidad, marketing o capacitación. Los clientes pueden usar prompts en lenguaje natural para controlar el estilo visual y el ritmo, incluido el movimiento de la cámara, la rotación y el zoom.

Amazon Nova tendrá tres modelos de IA multimodales (capaces de procesar distintos tipos de archivos), y uno de texto veloz

Amazon Nova Micro, Lite y Pro admiten más de 200 idiomas. Amazon Nova Micro admite una longitud de contexto de 128,000 tokens de entrada, mientras que Amazon Nova Lite y Amazon Nova Pro admiten una longitud de contexto de 300,000 tokens, o 30 minutos de procesamiento de video. A principios del 2025, Amazon admitirá una longitud de contexto de más de 2 millones de tokens de entrada.

Los modelos también admiten ajustes finos personalizados, que permiten a los clientes indicarles ejemplos en sus propios datos propietarios que han sido etiquetados para aumentar la precisión.

Lo próximo: modelos de voz a voz y multimodal a multimodal

Amazon presentará un modelo de voz a voz de Amazon Nova en el primer trimestre de 2025. El modelo está diseñado para transformar las aplicaciones de IA conversacional al comprender la entrada de voz en lenguaje natural, interpretar señales verbales y no verbales (como el tono y la cadencia) y brindar interacciones naturales reciprocas, similares a las humanas, con baja latencia.

Amazon también está desarrollando un modelo que puede tomar texto, imágenes, audio y video como entrada y generar salidas en cualquiera de estas modalidades. Este modelo Amazon Nova con capacidades nativas de multimodal a multimodal (o de cualquier modalidad a cualquier modalidad) se presentará a mediados de 2025.

LA NACION

Conforme a

Así es Nova, el competidor de ChatGPT de Amazon, con herramientas de creación de imágenes y video

Andy Jassy, CEO de Amazon, anunció nuevos modelos de IA que serán parte de la librería de Amazon Bedrock en AWS

Un ejemplo de cómo funciona Amazon Nova

Los distintos modelos de IA que tendrá Amazon Nova

Lo próximo: modelos de voz a voz y multimodal a multimodal

Otras noticias de Inteligencia artificial

"Páginas vacías y escritores sin sueldo". Unos 10.000 escritores firman un libro en blanco para protestar contra el “robo” de la IA

Según la Consumer Federation of America. EE.UU. pierde US$119.000 millones al año por estafas

El anonimato en internet ya no existe. Así de fácil es desenmascarar cuentas con seudónimo

Xiaomi incorpora robots humanoides a su fábrica de autos eléctricos en Pekín

Científicos argentinos crearon Retinar: usan IA para la detección precoz de enfermedades de la vista

Gemini se integra aún más con Google Drive, Docs, Hojas de cálculo y Presentaciones

¿Qué profesiones van a desaparecer con la IA? La respuesta de uno de los expertos argentinos más escuchados

Últimas Noticias

Hablá con mi asistente. Cómo usar la IA para filtrar llamadas de desconocidos o spam en el celular

El anonimato en internet ya no existe. Así de fácil es desenmascarar cuentas con seudónimo

Mundo animal. Cómo activar el "modo yaguareté" de WhatsApp