Google premia a tres proyectos argentinos sobre salud y aprendizaje automático
En una nueva edición de los Premios de Investigación de Google para América Latina, LARA (las siglas de Latin America Research Awards) se anunciaron los 24 proyectos seleccionados de 2021, entre los cuales aparecen tres liderados por equipos de investigadores de la Argentina
- 7 minutos de lectura'
En una nueva edición de los Premios de Investigación de Google para América Latina, LARA (las siglas de Latin America Research Awards) se anunciaron los 24 proyectos seleccionados de 2021, entre los cuales aparecen tres liderados por equipos de investigadores de la Argentina.
Sus trabajos estuvieron enfocados en analizar aspectos genéticos y evolutivos de cepas autóctonas del COVID-19 en barrios vulnerables de la ciudad de Buenos Aires; construir modelos causales altamente interpretables a partir de noticias periodísticas; y el aprendizaje de incrustaciones moleculares para la reutilización de fármacos.
En un contexto donde la ciencia juega un rol fundamental en la lucha contra la pandemia, este año se puso especial foco en las categorías vinculadas al COVID-19.
Los premios LARA fueron creados hace 9 años para fomentar la innovación y la investigación científica en la región, estimular el espíritu emprendedor y fortalecer la relación entre Google y la academia. “Durante los últimos 2 años quedó en evidencia que la humanidad tiene aún enormes desafíos por resolver. Desde Google, estamos felices de apoyar a quienes, con su trabajo y con sus investigaciones, están buscando hoy las respuestas para los retos de mañana”, destacó Adriana Noreña, Vicepresidenta de Google para Hispanoamérica.
Los 24 proyectos seleccionados fueron elegidos entre un total de más de 700 presentados en toda la región y se repartirán 500.000 dólares entre los ganadores.
Los trabajos argentinos se destacan por pertenecer a las áreas de salud y machine learning.
Analizar la difusión del Covid en barrios vulnerables
Genómica y metagenómica del virus SARS-CoV-2 en Argentina: el proyecto implica un análisis exhaustivo de aspectos genéticos y evolutivos de cepas autóctonas: liderado por Mariana Viegas y Mercedes Soledad Nabaes Jodar, el objetivo es analizar la transmisión y evolución del SARS-CoV-2 en barrios vulnerables de la ciudad de Buenos Aires, y realizar la secuenciación genómica del virus a través de técnicas de secuenciación masiva llamadas “Next Generation Sequencing”.
El coronavirus ingresó en la ciudad de Buenos Aires a principios de 2020, se estableció y empezó a circular por todo el país. Tanto a Viegas como a Nabaes Jodar les interesaba estudiar ese ingreso del coronavirus a barrios vulnerables con condiciones de viviendas sin posibilidades de aislamiento y entender cómo se distribuía en las poblaciones y compararlo con otros barrios de la ciudad. “Estudiamos dos casos particulares que nos mostraron cómo al principio de la pandemia el virus ingresó, y esto nos permitió darnos cuenta de qué manera las condiciones de la vivienda hacían que se transmitiera rápidamente en esta población alcanzando a la gran mayoría de las personas que residían allí. Nuestra hipótesis tenía que ver con que las características de transmisión del virus podrían ser diferentes en estas condiciones habitacionales que en otras”, explican.
Por otro lado, se propusieron correlacionar la severidad de las infecciones producto del coronavirus y asociarlas a si había alguna relación con los microbiomas nasofaríngeos que presentaban los pacientes infectados. “Este es un objetivo que vamos a cumplir en esta nueva etapa del proyecto. Nuestra primera etapa fue la de producir los genomas, hacer la secuenciación de las muestras y compararlas con las secuencias de otros barrios de la ciudad Buenos Aires, luego analizar la forma evolutiva de estos virus y las formas de transmisión que se dieron en estos barrios para tratar de correlacionarlos con las características de los microbiomas nasofaríngeos de los pacientes”, agregan.
Con el correr de la pandemia, el equipo caracterizó las variantes que fueron ingresando a nuestro país a partir de diciembre de 2020, y en particular en la ciudad de Buenos Aires. “Hicimos una descripción sistemática de las variantes que fueron circulando. Todos esos datos que hemos generado han permitido contribuir a tener información a nivel de salud pública, porque sabiendo qué variantes ingresaron, qué riesgos tenían y avisando rápidamente al sistema de salud, pudimos contribuir a que se tomen decisiones a nivel de salud pública”, señalan; entre ellas, técnicas de diagnóstico específicas y estudios de respuesta ante las vacunas.
Aprender con las noticias online
Aprendizaje de modelos causales a partir de medios digitales: Encabezado por Ana Gabriela Maguitman y Mariano Maisonnave en el Instituto de Ciencias e Ingeniería de la Computación (ICIC, CONICET - Universidad Nacional del Sur) de Bahía Blanca, Argentina, el objetivo del proyecto es construir modelos causales altamente interpretables a partir de noticias periodísticas.
Para lograrlo, las primeras etapas del proyecto estuvieron orientadas a la aplicación de técnicas de recuperación de información, procesamiento de lenguaje natural y aprendizaje automático para extraer eventos y otras variables relevantes de un gran volumen de textos de noticias. Además, desarrollaron una plataforma que combina distintas técnicas de aprendizaje causal para ser aplicada sobre las variables extraídas de las noticias.
Las variables fueron extraídas semi-automáticamente de textos de artículos periodísticos. Para lograr esto se apoyaron en varias herramientas de procesamiento de lenguaje natural y desarrollaron métodos capaces de extraer conceptos relevantes de dichos textos. Estos conceptos se representan como un texto corto.
“En uno de nuestros experimentos, como contábamos con un gran corpus de noticias correspondiente al período 1987-2007, realizamos un análisis de causalidad sobre la Guerra de Irak. Nuestros métodos detectaron términos y eventos relevantes de manera automática, por ejemplo Invasión a Kuwait, Guerra del Golfo, Armas de destrucción masiva, entre otras. Análisis causales posteriores indicaron posibles vínculos causales encontrados entre alguna de estas variables”, señala el equipo.
Los métodos funcionan de manera independiente del dominio que se esté modelando. Actualmente están trabajando con noticias relacionadas a fenómenos financieros/económicos. “Por ejemplo, en el contexto de noticias vinculadas a la Crisis Financiera Global de 2008 podríamos identificar (idealmente) conceptos relevantes tales como burbuja inmobiliaria, crisis de liquidez, recesión, pánico bursátil, etc.”, detallan.
Un análisis causal posterior podría dar información sobre los vínculos entre estos conceptos y otras variables para ayudar a un experto a entender mejor dicha crisis. Dado que hay patrones que suelen repetirse a lo largo del tiempo, los modelos causales aprendidos del pasado pueden servir para entender mejor fenómenos similares que ocurren en el presente, en la medida en que existan suficientes datos para analizar estos fenómenos.
“Por tratarse de un trabajo de investigación nos centramos en investigar que la herramienta diera lugar a modelos causales correctos. Para esto nos concentramos en analizar la herramienta, y no los escenarios. Llevar a cabo experimentos para determinar si un experto pudo llegar a conclusiones en escenarios complejos que sin los modelos causales no hubieran sido posibles no es una tarea trivial, y es parte de nuestro trabajo futuro”, agregan.
Cómo reutilizar fármacos contra el coronavirus
Aprendizaje de Representaciones Moleculares Vectoriales para el Reposicionamiento de Fármacos. Presentado por Axel Soto y María Virginia Sabando, el proyecto tiene como objetivo estudiar y desarrollar representaciones moleculares novedosas para compuestos químicos y su uso para diferentes tareas, tales como el modelado QSAR, la reutilización de fármacos y la aplicación de modelos generativos para diseño de novo.
El proyecto se centra en diseñar nuevas formas de representar compuestos químicos empleando aprendizaje automático, de forma tal que la computadora pueda interpretar la información del compuesto químico.
“A partir de ello, el objetivo es estudiar cómo estas representaciones impactan en distintas tareas del proceso de diseño de fármacos asistido por computadora. En particular, nos interesan el reposicionamiento de fármacos, estrategia que identifica nuevos usos de medicamentos aprobados para otros fines terapéuticos, y el modelado QSAR, que aborda la creación de modelos predictivos que relacionan la actividad biológica de los fármacos con sus propiedades fisicoquímicas”, explican Soto y Sabando.
Los modelos de reposicionamiento de fármacos permiten encontrar nuevos usos terapéuticos a fármacos aprobados para otros tratamientos. Esta estrategia resulta especialmente útil ante crisis y emergencias sanitarias como lo es la pandemia de COVID 19, donde existen pocas opciones terapéuticas y el avance de la enfermedad en la población es vertiginoso. “Nuestro proyecto apunta a desarrollar modelos de reposicionamiento que permitirían no solo acelerar el proceso de descubrimiento de fármacos efectivos contra el COVID 19, sino además proporcionar información valiosa para la identificación de fármacos candidatos para el tratamiento de otras enfermedades causadas por coronavirus”, indican.
Este año, el proyecto se va a enfocar en desarrollar un algoritmo basado en técnicas de aprendizaje automático para aprender representaciones moleculares. “Planeamos emplear técnicas del estado del arte, tales como modelos generativos, y emplear diversas fuentes de datos químicos” y cierran: “Nuestro objetivo es utilizar y evaluar nuestro método en la generación y reposicionamiento de fármacos para el tratamiento de COVID 19″.