Una actualización de la plataforma ahora permite que reciba comandos en forma oral y los responda leyendo los textos
- 2 minutos de lectura'
ChatGPT, de OpenAI, está recibiendo una importante actualización que permitirá al popular chatbot mantener conversaciones de voz con los usuarios e interactuar mediante imágenes, acercándose así a asistentes de inteligencia artificial (IA) tan conocidos como Siri, de Apple.
La función de voz “abre las puertas a muchas aplicaciones creativas y centradas en la accesibilidad”, dijo OpenAI en una entrada de blog el lunes.
Otros servicios de IA similares, como Siri, el asistente de voz de Google y Alexa, de Amazon.com, están integrados en los dispositivos en los que funcionan y suelen utilizarse para programar alarmas y recordatorios y ofrecer información de internet.
Desde su debut el año pasado, ChatGPT ha sido adoptado por empresas para una amplia gama de tareas, desde resumir documentos hasta escribir códigos informáticos, lo que ha desencadenado una carrera entre las grandes empresas tecnológicas por lanzar sus propias ofertas basadas en la IA generativa.
La nueva función de voz de ChatGPT también puede narrar cuentos antes de dormir, zanjar debates en la mesa y pronunciar en voz alta textos introducidos por los usuarios. Según la firma, las interacciones habladas se hicieron más realistas al contar con las voces de actores.
La tecnología en la que se basa está siendo utilizada por Spotify para que los podcasters de la plataforma traduzcan sus contenidos a diferentes idiomas, según OpenAI.
Con el soporte de imágenes, los usuarios pueden hacer fotos de las cosas que les rodean y pedir al chatbot que “resuelva el problema de por qué no arranca la parrilla, explore el contenido de la nevera para planificar una comida o analice un gráfico complejo para obtener datos relacionados con el trabajo”. Los ejemplos sobre cómo las nuevas funciones pueden usarse incluyen desde hacer una foto del interior de un refrigerador para obtener sugerencias de recetas hasta una foto de la tarea de matemáticas de un niño para recibir ayuda resolviendo los problemas.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Google Lens, de Alphabet, es actualmente la opción más popular para obtener información sobre imágenes.
Las nuevas funciones ChatGPT se lanzarán para los suscriptores de sus planes Plus y Enterprise en las próximas dos semanas.
Con información de Reuters y AFP