Así es Nova, el competidor de ChatGPT de Amazon, con herramientas de creación de imágenes y video
Andy Jassy, CEO de Amazon, anunció nuevos modelos de IA que serán parte de la librería de Amazon Bedrock en AWS
- 4 minutos de lectura'
LAS VEGAS.- Amazon anunció una serie de modelos de IA bajo el nombre Nova, que compiten con ChatGPT y Gemini, y estarán disponibles dentro de la librería de Amazon Bedrock en AWS para todos los usuarios del servicio. El anuncio vino de la mano del Presidente y CEO de la compañía, Andy Jassy, en el evento AWS: reInvent 2024, que está tomando lugar del 2 al 6 de diciembre en Las Vegas, Nevada, Estados Unidos.
Se anunciaron cuatro modelos multimodales (que pueden procesar distintos tipos de archivo, no solo texto, por parte del usuario), además de uno para crear imágenes y otro para crear videos. Además, contarán con una función “voz a voz” (el usuario le habla a la IA, y esta le contesta hablando). “Nova brindará inteligencia de vanguardia y una relación precio-rendimiento líder en la industria”, afirmó Jassy en su conferencia en AWS: reInvent del martes 3 de diciembre.
Cuatro de estos modelos ya están disponibles, y dos se lanzarán en el primer trimestre de 2025.
“En Amazon, tenemos cerca de 1,000 aplicaciones de IA generativa en funcionamiento y hemos tenido una visión general de lo que los desarrolladores de aplicaciones aún están afrontando”, afirmó Rohit Prasad, vicepresidente de Inteligencia Artificial General de Amazon. “Nuestros nuevos modelos Amazon Nova están pensados para ayudar a los desarrolladores internos y externos a afrontar estos desafíos, y proporcionar una inteligencia y una generación de contenido convincentes”.
Un ejemplo de cómo funciona Amazon Nova
Los distintos modelos de IA que tendrá Amazon Nova
Amazon Nova Micro: un modelo solo de texto, bien rápido, que brinda respuestas rápidas y con bajo costo. Para soluciones rápidas y no tan complejas, y que sean solo de texto. Ya disponible.
Amazon Nova Lite: un modelo multimodal de bajo costo, puede procesar imágenes, videos y texto y responde rápido. Ya disponible.
Amazon Nova Pro: un modelo multimodal más avanzado, no tan rápido pero capaz de procesar tareas mucho más complejas. Ya disponible.
Amazon Nova Premier: el modelo multimodal más capacitado, capacitado para resolver tareas que requieran razonamiento avanzado. Se lanzará en el primer trimestre de 2025
Amazon Nova Canvas: para generar imágenes a partir de un prompt (instrucciones) de texto. Se le pueden especificar distintos estilos de arte, o mismo proporcionarle una imagen y pedirle que copie el estilo de esa imagen. También proporciona funciones que facilitan la edición de imágenes mediante entradas de texto y proporciona controles para ajustar el esquema de colores y el diseño. Ya disponible
Amazon Nova Reel: para generar videos a partir de un prompt de texto. Se lanzará también en el primer trimestre de 2025. Servirá para la creación de contenido en publicidad, marketing o capacitación. Los clientes pueden usar prompts en lenguaje natural para controlar el estilo visual y el ritmo, incluido el movimiento de la cámara, la rotación y el zoom.
Amazon Nova Micro, Lite y Pro admiten más de 200 idiomas. Amazon Nova Micro admite una longitud de contexto de 128,000 tokens de entrada, mientras que Amazon Nova Lite y Amazon Nova Pro admiten una longitud de contexto de 300,000 tokens, o 30 minutos de procesamiento de video. A principios del 2025, Amazon admitirá una longitud de contexto de más de 2 millones de tokens de entrada.
Los modelos también admiten ajustes finos personalizados, que permiten a los clientes indicarles ejemplos en sus propios datos propietarios que han sido etiquetados para aumentar la precisión.
Lo próximo: modelos de voz a voz y multimodal a multimodal
Amazon presentará un modelo de voz a voz de Amazon Nova en el primer trimestre de 2025. El modelo está diseñado para transformar las aplicaciones de IA conversacional al comprender la entrada de voz en lenguaje natural, interpretar señales verbales y no verbales (como el tono y la cadencia) y brindar interacciones naturales reciprocas, similares a las humanas, con baja latencia.
Amazon también está desarrollando un modelo que puede tomar texto, imágenes, audio y video como entrada y generar salidas en cualquiera de estas modalidades. Este modelo Amazon Nova con capacidades nativas de multimodal a multimodal (o de cualquier modalidad a cualquier modalidad) se presentará a mediados de 2025.
Otras noticias de Inteligencia artificial
- 1
Presentan en China un robot porteador capaz de transportar personas en terrenos escarpados
- 2
Lamborghini Miura modelo 2025: así sería el histórico vehículo, según la IA
- 3
Las mejores 150 frases para saludar por el Año Nuevo 2025 a través de WhatsApp e Instagram
- 4
Cuáles son las cinco frases que más repiten las personas tóxicas, según la inteligencia artificial