CORNETO: aprendizaje automático para descifrar datos ómicos complejos... y mucho más
Tabla de contenido
Científicos del EMBL-EBI (European Molecular Biology Laboratory-European Bioinformatics Institute), en colaboración con la Universidad de Heidelberg, desarrollaron CORNETO, una nueva herramienta computacional que emplea técnicas de aprendizaje automático para extraer información significativa de datos biológicos complejos. CORNETO permite a los usuarios reconstruir redes moleculares, que son mapas de interacciones entre genes, proteínas y vías de señalización, combinando datos experimentales de distintas muestras y condiciones con datos biológicos ya conocidos, como redes de señalización o metabolismo. Esto facilita la comprensión de los mecanismos que determinan si una célula está sana o enferma.
¿Qué es CORNETO? #
-
CORNETO es una nueva herramienta computacional que permite a los investigadores combinar distintos tipos de datos biológicos con datos y conocimiento biológico previo para mapear cómo interactúan moléculas como genes y proteínas dentro de las células.
-
Al analizar múltiples muestras de forma conjunta, CORNETO revela qué procesos biológicos son comunes y cuáles son específicos según el tipo celular o las condiciones experimentales.
-
Los investigadores han utilizado CORNETO para identificar rutas compartidas y específicas en estudios sobre enfermedades, por ejemplo, para detectar vías de señalización asociadas con la resistencia a la quimioterapia en pacientes con cáncer de ovario.
La comprensión de cómo interactúan las moléculas dentro de nuestras células es fundamental para identificar los mecanismos que pueden fallar y conducir a enfermedades. Sin embargo, a medida que aumentan el volumen y la complejidad de los datos ómicos disponibles, los investigadores enfrentan dificultades para extraer patrones útiles y con sentido biológico. CORNETO - acrónimo de Constrained Optimisation for the Recovery of NETworks from Omics - combina técnicas de aprendizaje automático y conocimiento biológico previo para analizar simultáneamente múltiples tipos de datos ómicos, como transcriptómica, proteómica y metabolómica. Las tres mencionadas apenas un momento atrás, junto a la genómica, la metagenómica y la fenómica, son disciplinas de la Biología.
“Queríamos resolver un desafío común en la biología de sistemas: cómo interpretar los datos ómicos cuando se dispone de tantos datos complejos al mismo tiempo”, explicó Julio Saez-Rodriguez, Director de Investigación en EMBL-EBI y profesor en excedencia en la Universidad de Heidelberg. “CORNETO ayuda combinando estos datos complejos con información previa proveniente de bases de datos biológicas, para identificar patrones que sean consistentes, interpretables y con relevancia biológica”.
Análisis ómico unificado #
Tradicionalmente, los científicos analizan los datos de un tipo a la vez - por ejemplo, comparando células sanas con células enfermas - y construyen redes de interacción separadas para cada caso. Sin embargo, este enfoque puede pasar por alto la visión global. CORNETO utiliza aprendizaje automático para analizar múltiples muestras o condiciones de forma conjunta, destacando los procesos biológicos compartidos entre conjuntos de datos y señalando las diferencias específicas. Además, está diseñado para ser personalizable y adaptable a casos de uso específicos o a nuevos tipos de datos.
“Utilizar CORNETO es como encontrar los hilos comunes en una red enmarañada”, afirmó Pablo Rodríguez-Mier, investigador postdoctoral en la Universidad de Heidelberg. “Ayuda a los investigadores a identificar los procesos biológicos clave que ocurren en muchas muestras y a entender qué es igual o distinto en cada una”.
Aplicaciones reales #
CORNETO resulta especialmente útil en campos como la investigación oncológica, donde existen similitudes entre pacientes, pero ningún paciente es exactamente igual a otro. Para demostrar su utilidad, los investigadores utilizaron CORNETO para analizar datos de expresión génica de múltiples pacientes con cáncer, con el fin de descubrir qué vías de señalización intracelular estaban funcionando de manera anómala.
Utilizando únicamente datos transcriptómicos, CORNETO identificó quinasas clave desreguladas - enzimas que regulan la señalización celular - que también fueron detectadas de manera independiente mediante fosfoproteómica. Las redes resultantes revelaron tanto rutas compartidas como diferencias específicas de cada paciente, un avance hacia el tipo de conocimientos que podrían respaldar tratamientos personalizados en el futuro.
Actualmente, CORNETO también se está utilizando en el proyecto europeo DECIDER para identificar vías de señalización desreguladas asociadas con la resistencia a la quimioterapia en pacientes con cáncer de ovario.
Los investigadores también aplicaron CORNETO al análisis de rutas metabólicas en cepas de levadura con diferentes genes inactivados. En este caso, CORNETO fue capaz de identificar los procesos clave que las células de levadura utilizaban para sobrevivir y crecer. Comprender estos procesos esenciales podría ayudar a diseñar cepas de levadura más eficientes para la producción de biocombustibles y otros productos en aplicaciones industriales.
Código abierto y listo para usar #
CORNETO está disponible como software de código abierto en GitHub. Allí también se pueden encontrar tutoriales, conjuntos de datos de ejemplo y un código modular que permite adaptar la herramienta a distintas necesidades.
A ver, cómo explicar la importancia de que CORNETO sea de código abierto. Apple es una empresa que utiliza código propietario, al igual que Microsoft, por ejemplo, o Google, por citar algunos casos y no aburrir. Linus Torvalds, quien desarrolló el entorno Linux -espero no simplificarlo demasiado-, cuando lo logró, entró a las redes existentes muchos años atrás -no estaban Facebook, X, Instagram-, y abrió su desarrollo a que fuera analizado, criticado, mejorado por desarrolladores de todo el mundo. Apple, Microsoft, la NASA… y podríamos seguir… aprovecharon el desarrollo de Torvalds.
Cita #
- El artículo Unifying multi-sample network inference from prior knowledge and omics data with CORNETO (Unificación de la inferencia de redes multimuestra a partir de conocimientos previos y datos ómicos con CORNETO), fue publicado en Nature Machine Intelligence. Autores: Pablo Rodríguez-Mier, Martín Garrido-Rodríguez, Attila Gabor & Julio Sáez-Rodríguez (quien es autor correspondiente).
Financiación #
Este trabajo ha sido financiado por el programa Horizon 2020 de la Unión Europea bajo el acuerdo de beca No 951773 ( PerMedCoE) y No 965193 ( DECIDER).