Ingeniería inversa para detectar y rastrear el origen de los 'deepfake'
Facebook y la Universidad Estatal de Michigan (Estados Unidos) han trabajado en un nuevo enfoque basado en la ingeniería inversa para no solo detectar los 'deepfakes' sino también rastrearlos para identificar el modelo que los ha generado, con el objetivo de combatir la desinformación
Los contenidos conocidos como 'deepfakes', aquellos manipulados con sistemas de inteligencia artificial, ofrecen un nivel de realismo que preocupa por sus implicaciones para el debate público y la confianza depositada en figuras de autoridad.
Los 'deepfake' son imágenes o vídeos donde se ha manipulado el rostro, o también la voz para introducir un discurso determinado, a veces con fines de entretenimiento, pero maliciosos en otras ocasiones.
Distinguirlos de una persona real no siempre es fácil, y con ello en mente, Facebook se ha asociado con la Universidad Estatal de Michigan para desarrollan un método de detección y rastreo basado en la ingeniería inversa.
La compañía tecnológica reconoce que la ingeniería inversa no es un enfoque nuevo en el ámbito del aprendizaje profundo, pero lo defiende cómo método para combatir los 'deepfakes', ya que permite "descubrir los patrones únicos detrás del modelo de IA utilizado para generar una sola imagen 'deepfake'".
"Esta capacidad para detectar qué 'deepfakes' se han generado a partir del mismo modelo de IA puede ser útil para descubrir casos de desinformación coordinada u otros ataques maliciosos lanzados mediante 'deepfakes'", explican los investigadores Xi Yin y Tal Hassner en una publicación en Facebook AI.
Al igual que ocurre con las cámaras y la fotografía digital, el modelo generativo deja una "huella" en cada imagen que produce, "patrones sutiles pero únicos" que permiten identificarlo. Sin embargo, las técnicas de aprendizaje profundo han hecho que más difícil la identificación de las propiedades de dichas huellas al hacer "ilimitado" el conjunto de herramientas que se pueden utilizar para generar imágenes.
El sistema de Facebook y la Universidad Estatal de Michigan parte de las propiedades de la huella general, como la magnitud, la naturaleza repetitiva, el rango de frecuencia y la respuesta de frecuencia simétrica, que aplican a su red de estimación de huellas dactilares (FEN) y sirven, a su vez, como entradas para el análisis del modelo.
Con ella lo que hacen es, por un lado, descubrir las propiedades del modelo que ha generado el 'deepfake' y, por otro, comparar y rastrear similitudes entre un conjunto de 'deepfakes'. El objetivo de su método es "facilitar la detección y el rastreo de 'deepfake' en entornos del mundo real".