Se estima que casi el 75% de la población mundial va a vivir a grandes metrópolis para el año 2050 y la IA predijo cómo se van a ver muchas de ellas
- 4 minutos de lectura'
La Inteligencia Artificial emerge como una tecnología revolucionaria en la era digital, prometiendo transformar la forma en que abordamos el estudio y el trabajo en diversos campos. Desde el procesamiento del lenguaje natural hasta el reconocimiento de voz, sus avances tienen un impacto significativo. Una de sus aplicaciones más impactantes es la generación de imágenes realistas, que ha ganado popularidad en los últimos años.
Ciudad de los 15 minutos
En la actualidad, la Inteligencia Artificial ofrece una visión única del posible futuro de algunas de las principales ciudades del mundo. Existen muchas imágenes creadas por esta herramienta que sin duda sorprenden al espectador. En medio de la congestión y contaminación que caracterizan a los espacios urbanos, casi la mitad de la población mundial reside en ciudades, y se estima que esta cifra aumentará al 75% para el año 2050.
La visión de la Inteligencia Artificial muestra las ciudades de manera sorprendentemente realista, invitando a la comparación con imágenes actuales. En este contexto, la “Ciudad de los 15 minutos” se destaca como el modelo urbano aspiracional. Este concepto implica que todas las necesidades esenciales de las personas se encuentran a una distancia de entre 15 minutos y una hora caminando. Es una estrategia inteligente para reducir las emisiones contaminantes, en contraste con el impacto ambiental del transporte público.
Las ciudades modernas buscan adoptar el modelo de la Ciudad de los 15 minutos, y la Inteligencia Artificial se convierte en una herramienta valiosa para lograrlo. Es relevante señalar que existen espacios diseñados hace siglos que ya siguen este modelo, demostrando que la planificación organizada beneficia a los habitantes.
La Inteligencia Artificial de Apple: genera imágenes a partir de una única frase
Apple ha lanzado MGIE, una novedosa tecnología de Inteligencia Artificial de libre uso que posibilita la edición de imágenes a través de instrucciones simples. Este avance fue posible por la colaboración de la compañía con la Universidad de California en Santa Bárbara.
El sistema de Apple se fundamenta en lo que se denomina “edición de imágenes guiada”. Esto implica que mediante tecnologías avanzadas que comprenden tanto texto como imágenes (conocidas como modelos de lenguaje multimodal de gran escala), MGIE puede interpretar las solicitudes de una persona y modificar una imagen en detalle, píxel por píxel.
Por ejemplo, si el usuario le solicita a la Inteligencia Artificial que “intensifique el tono azul del cielo” en una fotografía, MGIE comprenderá la instrucción y ajustará la imagen según la solicitud.
Los investigadores señalan que, en ocasiones, las instrucciones dadas por las personas son breves y directas, lo que complica su interpretación para los sistemas actuales. Sin embargo, los modelos de lenguaje grande, que comprenden tanto texto como imágenes (MLLM), demuestran un enorme potencial para interpretar y responder a estas instrucciones mediante la edición visual.
En el caso del método desarrollado, MGIE opera en dos fases con estos MLLM. En primer lugar, traduce las instrucciones escritas por el usuario en comandos más detallados y específicos que facilitan la edición. Por ejemplo, si alguien desea que el césped en una fotografía luzca más verde, MGIE podría interpretar esto como “aumentar la saturación de verde en el área correspondiente al césped en un 20%”. Este comando claro es el que se utiliza para editar la imagen.
Posteriormente, en una segunda etapa, emplea estos modelos avanzados para concebir una representación visual precisa de cómo debería lucir la edición final. Este procedimiento genera una pauta para ajustar la imagen, alterando cada píxel según sea necesario. De esta manera, MGIE puede llevar a cabo cambios específicos, incluso con instrucciones breves o ambiguas, prescindiendo de información adicional y proporcionando resultados que cumplan con las expectativas del usuario.
Los creadores dicen que este sistema optimiza de manera significativa la precisión de las ediciones.
Otras noticias de Inteligencia artificial
Pensar, sentir, descansar. Sigue el debate sobre la conciencia de la inteligencia
Oportunidades. Cuáles son los trabajos mejor pagados en California para migrantes, según ChatGPT
Con fuerte presencia de la IA. Siete hallazgos científicos y médicos que se destacaron en 2024 por su impacto en la vida humana
- 1
Un ómnibus chocó con un camión y se prendió fuego: 32 muertos
- 2
Giorgia Meloni, el Papa Francisco, un gobernador peronista y un “ídolo” libertario: el podio de quienes le hicieron regalos a Javier Milei
- 3
Por qué los mayores de 60 años no deberían tomar vitamina D
- 4
Simeone, De Paul, Álvarez, Molina: el Asadito mecánico del Atlético de Madrid cocinó un triunfo histórico en Barcelona