Pau Martí Felip cambió de oficio en su empresa: ahora es ‘ingeniero de peticiones’, labor impulsada por las primeras aplicaciones, pero con futuro incierto
- 9 minutos de lectura'
Pau Martí Felip, de 23 años y graduado en Comunicación Audiovisual, entró a trabajar hace dos años como editor de videos en una empresa digital. Con el tiempo, vio que su labor cambiaba: “Así surgió ser prompt engineer [ingeniero de peticiones], que es una mezcla creativa y tecnológica de dar instrucciones a las IA para que te den respuesta”, dice. Las nuevas aplicaciones de inteligencia artificial para crear imágenes, texto y pronto video o música necesitan recibir peticiones en texto de lo que queremos. Esa petición puede ir de una frase sencilla (“prepara unos estiramientos de 10 minutos para mayores de 70 años”) a una intrincada instrucción de ocho líneas que incluye detalles sobre los colores, fondos o técnicas de una imagen, por ejemplo.
“La gente necesitará entender a la máquina”, dice Martí Felip. “Es como hablar con un animal con quien la mayoría de gente no sabe comunicarse, estamos aprendiendo ese lenguaje”, añade. Una búsqueda en LinkedIn de “prompt engineer” y “España” da solo seis perfiles en total y una oferta de trabajo. La oferta es precisamente de la empresa de Martí Felip, Raona, que se dedica a la transformación digital en empresas y tiene más de “240 colaboradores”. Esa oferta única de empleo para “ingenieros de peticiones” en España es prueba de su carácter exploratorio. En febrero viralizó una oferta de prompt engineer de una start up grande en EE.UU. con un sueldo envidiable.
Wow - Anthropic (Google's latest $300M AI investment) is hiring a "Prompt Engineer" for $250k-$335k/yr + equity
— AI Breakfast (@AiBreakfast) February 14, 2023
No CS degree required, just have "at least basic programming and QA skills"
Wild times. pic.twitter.com/4i1sEWs5iZ
La oferta de trabajo es para ayudar a Martí Felip, que es consciente de que busca candidatos en un terreno desierto. “De momento, la mayoría de currículums no tiene habilidades en IA. Si haces cuatro preguntas sobre ControlNet o algo más avanzado, ya lo ves”, afirma. Pero está dispuesto a conformarse: “Igual ya nos vale alguien con ganas de aprender y muy creativo”. Aunque parezca llamativo, Raona no busca ahora más informáticos: “Estamos llenos de programadores pero vemos que necesitamos gente más creativa”.
La aparición real de ingenieros de peticiones ha provocado un debate sobre su viabilidad y su futuro. Son profecías difíciles e incluso los más escépticos admiten dos cosas: es imposible prever nada hoy en ese campo y, a corto plazo (dos o tres años), será necesario un trabajo así.
“No es que las ofertas de prompt engineering me parezcan humo”, dice Javi López, inversor en startups y divulgador en temas de IA (conocido en redes como @javilop). “Me parecen algo temporal. Durante un periodo de transición, muchos van a necesitar gente específica ya formada. Pero en dos o tres años será trivial y no existirá el concepto de prompt como tal. Hasta un niño de 5 años podrá pedirle cosas a una máquina, de viva voz. Tenderá a cero la dificultad de ser un ingeniero de prompts”, asegura.
GPT-4 de un boceto hecho a mano en papel a una página completamente funcional, html, css y javascript. pic.twitter.com/1IiWzsMV2l
— Damián Catanzaro ☕️ (@DamianCatanzaro) March 14, 2023
Una novela ilustrada
Pero el propio López ha obtenido de momento más de 27.000 euros de financiación de 612 mecenas para una novela ilustrada con inteligencia artificial que incluye una guía sobre cómo iniciarse y las descripciones (prompts) que ha usado. Esa cifra multiplica casi por cinco la previsión inicial de López; hay interés por explorar este mundo. Quizá un día las peticiones serán sencillas, pero hoy los ejemplos de López incluyen fragmentos como esta retahíla (traducida aproximadamente del inglés original): “Ultrarrealista, ángulo bajo, sobre una mesa de madera en una hermosa cocina, Canon 5D, DSLR, retrato de 50 mm, DOF, representación de rayos V, 8k, trazado de rayos, iluminación Goldenhour, uplight, iluminación de borde rígido”.
El escepticismo de López procede de su creencia en que los profesionales de cada ámbito sabrán manejarse con las máquinas inteligentes, no hará falta un “ingeniero” nuevo: “También hubo expertos en Excel y ahora se espera que todo contable conozca las herramientas de su trabajo. Al final lo que quedará no es un ingeniero de prompts, sino quien ya era diseñador o artista antes. Aunque las barreras de entrada se van a reducir: ya no hará falta tanta técnica (de dibujo, iluminación, fotografía), sino más bien dirección y selección”, afirma.
Le pedí a GPT-4 un resumen de Don Quijote pero que cada palabra comience secuencialmente con la siguiente letra del abecedario.
— Esteban Cervi 🦌 (@EstebanCervi) March 14, 2023
🤯🤯🤯🤯🤯 pic.twitter.com/zYSCaYojNK
Pablo Moreno-Muñoz, investigador de la Universidad Técnica de Dinamarca, también cree que los modelos tenderán a simplificarse, al menos por tres vías: “Uno, entrenando las herramientas con más datos (imágenes, texto); dos, horas de ingeniería para construir modelos con mayor capacidad (número de parámetros, tamaño de las redes neuronales); y tres, tiempo de entrenamiento y dinero dedicado en los supercomputadores, donde las IA encuentran más y más relaciones entre los datos, que luego les permiten generar mejores resultados a partir de prompts”.
La distinción clave en este debate se reduce a una simple pregunta: ¿lograrán las IA entender lo que queremos decir como lo hace el buscador de Google hoy o las necesidades complejas de un futuro video, imagen, melodía o relato seguirá necesitando de especialistas? También puede ser que conviva un uso simple de estas herramientas con algo más sofisticado: hoy se puede buscar en Google o ser experto en SEO, y se puede usar Photoshop o simplemente aplicar un filtro.
El programador Simon Willison es un defensor de los ingenieros de prompts. Cree que necesitarán, además de habilidades comunicativas, algo de todas estas disciplinas: lingüística, entender cómo funciona el deep learning que mueve estos modelos, psicología, historia del arte, seguridad informática y filosofía. “¿Cómo podemos enseñarle a un modelo de lenguaje la diferencia entre la verdad y la ficción? ¿Qué es, de hecho, la verdad?”, se pregunta Willison.
Le he pedido a GPT-4 que me haga un juego de Pong con JavaScript. Con colisiones, IA para la máquina, puntuación, controles...
— Miguel Ángel Durán (@midudev) March 14, 2023
Y lo ha hecho a la primera. Entero. 😱 pic.twitter.com/YQ5WxMifje
Silviu Pitis, investigador de la Universidad de Toronto, ve también un futuro claro a este oficio: “A medida que los modelos se vuelvan más fuertes, todavía necesitaremos que los humanos interactúen con ellos, les enseñen a comunicarse”.
Cómo formarse para ello
La labor concreta de Martí Felip es doble: ayudar a los ingenieros a poner a prueba el modelo que están programando a partir por ejemplo de ChatGPT y luego usarlo para obtener resultados óptimos o ayudar al cliente a sacar provecho.
La formación es otro de los temas clave. Martí Felip echa de menos haber aprendido algo de código en la universidad. Pero la mayor parte de su formación ha sido autónoma: “Siempre me ha interesado la IA. He ido aprendiendo con tutoriales en YouTube, cuentas de Twitter y TikTok. En la universidad deberíamos haber hecho algo más de código. Sé conceptos básicos de programación, pero echo de menos algo de Python más avanzado. Aunque es interesante tener la parte creativa para el diseño”, explica.
Jessica Gutiérrez, auxiliar administrativa de Gijón, es otra de las seis personas que ha añadido “prompt engineer” a su bio de LinkedIn. Es auxiliar administrativa, pero se dedica a escribir para páginas web. El paso era casi obligado: “Ahora me lleva mucho menos tiempo, si no estás aprendiendo a generar texto, obviamente se va a quedar obsoleto tu trabajo de copy”, asegura. “Reconozco que, cuatro meses desde que empecé a investigar y empaparme todos los días, al final encuentras un aliado en la inteligencia artificial, aunque he recorrido un camino muy largo para posicionarme lo más temprano posible”, admite.
Su formación también ha sido en internet: “Ha sido autodidacta, ensayo y error, a base de ver videos en YouTube, en Twitch”, explica. Ahora ve el futuro como un campo abierto: “Hay mucho por delante para sentar bases de perfiles laborales. Participar en el ecosistema sirve mucho para explorar posibilidades de negocio y educativas”, asegura, aunque a su alrededor no lo ven claro: “La gente se ríe. No creen que esto tenga un futuro profesional. Y no creen que la herramienta me genere todo lo que le pido. Entre risas hice el libro”. Gutiérrez se refiere a que ha preparado un libro de recetas donde el texto y las ilustraciones son todas confeccionadas con inteligencia artificial: “Las recetas las saqué en una tarde. Tardé más con las ilustraciones”, detalla. Si le funciona bien, seguirá con uno infantil.
Y se hace sin código
Una de las maravillas de esta ingeniería es que saber código es secundario. Un detalle que baja las barreras de acceso. Andrej Karpathy, respetado programador que dirigió la IA de Tesla y acaba de reincorporarse a OpenAI (creadores de ChatGPT), tuiteó: “El lenguaje de programación más de moda es el inglés”.
The hottest new programming language is English
— Andrej Karpathy (@karpathy) January 24, 2023
Es posible, dice Ignacio Peis, investigador de la Universidad Carlos III, “calificar como nuevo lenguaje de programación al inglés, ya que unas líneas de texto generan rutinas de código de programación. Se podría pensar que se trata de un nuevo nivel de abstracción. Sin embargo, las relaciones de programación entre el lenguaje hablado y el código generado no están definidas, no son universales. Se puede comprobar que una misma entrada de texto puede generar códigos diversos, ya que hablamos de modelos probabilísticos”, explica.
El inglés, por tanto, no funciona siempre perfectamente igual como un lenguaje de programación. Pero eso no impide que tenga recorrido como un nuevo modo de relacionarse con la máquina: “En cierto modo es programar”, resume Pitis. “Como requisito para una IA sólida, las computadoras deberán poder comunicarse con los humanos a través del lenguaje natural. Si dicha interfaz se vuelve lo suficientemente fuerte, podemos enseñarles hablando con ellas”, añade.
Aunque el inglés es un posible lenguaje de programación, las máquinas también pueden vencer a los humanos en eso. Un artículo académico reciente lo prueba con peticiones automatizadas al intentar mejorar una petición humana, y lo logra si en algunas preguntas, se añade al final: “Piénsalo paso a paso”. En el estudio aseguran que la mejor fórmula sería algo así: “Vamos a resolver esto paso a paso para asegurarnos de que tenemos la respuesta correcta”. La carrera para lograr la petición perfecta solo ha empezado, asegura Gutiérrez, que hace sus pruebas aparte: “Tienes que estar muy seguro del prompt. Lo escribo aparte dos o tres veces y si no tengo todos los detalles, sigo añadiendo y no se lo pido a la máquina hasta que lo tengo completo”.
EL PAISOtras noticias de Inteligencia artificial
Más leídas de Tecnología
Proyectar confianza. Cuáles son las tres palabras que repiten las personas más seguras, según la inteligencia artificial
Como en Austin Powers. Rusia multa a Google por US$ 20.000 quintillones, más que todo el dinero que hay en el mundo
Según a la IA. Cuáles son los tres signos con "más suerte" en noviembre 2024
Cyber Monday 2024. Tres sitios para comparar precios y encontrar las verdaderas ofertas