Ir al contenido principal

La nueva IA AlphaGenome de DeepMind aborda la «materia oscura» de nuestro ADN

La nueva IA AlphaGenome de DeepMind aborda la «materia oscura» de nuestro ADN

Una pantalla digital que muestra letras de colores de una secuencia de ácido nucleico.

Los investigadores introducen grandes cantidades de datos genómicos en sistemas de aprendizaje automático para entrenarlos a predecir el papel de las secuencias no codificantes. Crédito: JuSun/iStock vía Getty

Casi 25 años después de que los científicos completaran el borrador de la secuencia del genoma humano, muchas de sus 3100 millones de letras siguen siendo un enigma. El 98 % del genoma que no está compuesto por genes codificadores de proteínas, pero que puede influir en su actividad, resulta especialmente desconcertante.

Un modelo de inteligencia artificial (IA) desarrollado por Google DeepMind en Londres podría ayudar a los científicos a comprender esta «materia oscura» y a ver cómo contribuye a enfermedades como el cáncer e influye en el funcionamiento interno de las células. El modelo, llamado AlphaGenome, se describe en una preimpresión del 25 de junio .

“Este es uno de los problemas más fundamentales no solo en biología, sino en toda la ciencia”, dijo Pushmeet Kohli, director de IA para ciencia de la compañía, en una conferencia de prensa.

El modelo "secuencia-función" toma largos tramos de ADN y predice varias propiedades, como los niveles de expresión de los genes que contienen y cómo esos niveles podrían verse afectados por mutaciones.

"Creo que es un gran avance", afirma Anshul Kundaje, genómico computacional de la Universidad de Stanford en Palo Alto, California, quien tuvo acceso anticipado a AlphaGenome. "Es una auténtica mejora en prácticamente todos los modelos de secuenciación a función de vanguardia actuales".

Un enfoque «todo en uno»

Cuando DeepMind presentó AlphaFold 2 en 2020 , avanzó mucho hacia la solución de un problema que había desafiado a los investigadores durante décadas: determinar cómo la secuencia de una proteína contribuye a su forma 3D.

Descubrir la función de las secuencias de ADN es diferente, ya que no existe una única respuesta, como en la estructura tridimensional que AlphaFold proporciona. Un único fragmento de ADN desempeñará numerosas funciones interconectadas: desde atraer un conjunto de mecanismos celulares para unirse a una sección específica de un cromosoma y convertir un gen cercano en una molécula de ARN, hasta atraer factores de transcripción de proteínas que influyen en dónde, cuándo y en qué medida se produce la expresión génica. Muchas secuencias de ADN, por ejemplo, influyen en la actividad génica alterando la forma tridimensional de un cromosoma, ya sea restringiendo o facilitando el acceso a los mecanismos que realizan la transcripción.

Los biólogos han estado investigando esta cuestión durante décadas con diversos tipos de herramientas computacionales. En la última década, aproximadamente, los científicos han desarrollado docenas de modelos de IA para comprender el genoma. Muchos de estos se han centrado en una tarea específica, como predecir los niveles de expresión génica o determinar cómo los segmentos modulares de genes individuales, llamados exones, se copian y pegan en proteínas distintas. Sin embargo, los científicos están cada vez más interesados ​​en herramientas integrales para interpretar secuencias de ADN.

AlphaGenome es uno de estos modelos. Puede aceptar entradas de hasta un millón de letras de ADN —una cantidad que podría incluir un gen y una gran cantidad de elementos reguladores— y realizar miles de predicciones sobre numerosas propiedades biológicas. En muchos casos, las predicciones de AlphaGenome son sensibles a cambios en una sola letra de ADN, lo que significa que los científicos pueden predecir las consecuencias de las mutaciones.

En un ejemplo, los investigadores de DeepMind aplicaron el modelo AlphaGenome a diversas mutaciones identificadas en estudios previos en personas con un tipo de leucemia. El modelo predijo con precisión que las mutaciones no codificantes activaban indirectamente un gen cercano, un factor desencadenante común de este cáncer.

Aún limitado

AlphaGenome se entrenó únicamente con datos genómicos y otros datos experimentales de humanos y ratones. Podría funcionar igual de bien en organismos relacionados, pero los investigadores no lo probaron, afirmó Žiga Avsec, científico de DeepMind, en la sesión informativa. El modelo tampoco fue diseñado para interpretar con fiabilidad el genoma de un individuo ni para proporcionar una visión completa de cómo las variantes influyen en enfermedades complejas.

La precisión de las predicciones de AlphaGenome puede mejorarse. Por ejemplo, el modelo tiene dificultades para identificar secuencias que alteran la expresión de un gen ubicado a más de 100.000 pares de bases de distancia. «Este modelo aún no ha resuelto la regulación génica con la misma eficacia que AlphaFold, por ejemplo, en la predicción de la estructura 3D de las proteínas», añade Kundaje.

Un aspecto que AlphaGenome, y modelos similares, aún no captan es cómo la naturaleza cambiante de una célula puede afectar el funcionamiento de las secuencias de ADN, afirma Peter Koo, biólogo computacional del Laboratorio Cold Spring Harbor de Nueva York. Estos modelos están entrenados para realizar predicciones en un entorno fijo, pero las células son dinámicas. Los niveles de proteínas, las etiquetas químicas del ADN y otras condiciones pueden variar con el tiempo o entre tipos celulares, lo que puede modificar el comportamiento de una misma secuencia.

Koo predice que los investigadores se basarán en AlphaGenome utilizando el modelo para diseñar secuencias de ADN "reguladoras" que permitan controlar cuándo y dónde se activa un gen, por ejemplo, o para realizar experimentos virtuales que simulen cómo responden las células a los cambios genéticos. Por ahora, los investigadores que realizan trabajos no comerciales pueden acceder al modelo a través de los servidores de DeepMind mediante una interfaz de programación. Se prevé una versión más completa para el futuro, que permitiría aplicaciones más sofisticadas.

doi: https://doi.org/10.1038/d41586-025-01998-w 

#AlphaGenome #InteligenciaArtificial #Genómica #DeepMind #InnovaciónCientífica

Comentarios

Entradas más populares de este blog

Los 30 neurocientíficos vivos más influyentes de hoy en día

Psicólogo ciego ayuda a otros a ver soluciones

Proyecto Abecedarian: un ensayo controlado aleatorio de educación temprana que ha seguido a niños desde 1971