Identifican fuentes de inestabilidad en el genoma asociadas al cáncer con una nueva herramienta informática
03 Nov 2025
Un equipo del Centro Andaluz de Biología del Desarrollo (CABD) y la Universidad Pablo de Olavide desarrolla una herramienta que permite predecir los sitios en el genoma donde se generan ‘compuestos’- llamados 3R asociados al origen del cáncer
El trabajo liderado por Pedro Martínez visibiliza la importancia de atajar las preguntas in silico para encontrar respuestas sin necesidad de experimentación
Un estudio internacional liderado por el investigador Pedro Martínez, del Centro Andaluz de Biología del Desarrollo (CABD) —centro mixto de la Universidad Pablo de Olavide, el Consejo Superior de Investigaciones Científicas (CSIC) y la Junta de Andalucía—, ha empleado un enfoque de aprendizaje automático en el estudio del genoma, centrado en los lugares donde se generan los bucles llamados 3R (estructuras híbridas de ADN y ARN), asociados a la inestabilidad genética y al origen del cáncer. Los resultados del estudio, publicados recientemente en la revista NAR Genomics and Bioinformatics, han permitido realizar predicciones específicas del genoma en mamíferos a través de información de secuencia y señales de secuenciación, contribuyendo en el avance de la comprensión biológica del genoma.
El equipo de científicos, compuesto por Thomas Vanhaeren y Federico Divina de la Universidad Pablo de Olavide de Sevilla, Ludovica Cataneo de la Universidad de Bologna y Pedro Martínez del Centro Andaluz de Biología del Desarrollo (CABD), ha realizado un enfoque bioinformático para estudiar esta dinámica de los sitios en el genoma donde se originan los bucles 3R, considerando las diferencias entre tipos celulares.
Dentro de las células, la información genética se encuentra en diversas formas como el ADN, el cual es capaz de copiarse en forma de ARN en un proceso que se conoce como transcripción. Si durante el proceso de transcripción se acumulan híbridos de ADN y ARN, se genera una fuente significativa de inestabilidad genómica asociada al origen del cáncer. Estos investigadores han desarrollado una herramienta de aprendizaje automático con un predictor de alta precisión, capaz de identificar áreas del genoma que presentan estas fuentes de inestabilidad. “Hasta ahora, las herramientas para predecir estos sitios se basaban únicamente en la secuencia de ADN, que es esencialmente la misma en todo el organismo, por lo que no era posible predecir la formación de híbridos en tipos celulares específicos. Nuestra herramienta hace uso de datos de secuenciación masiva para generar mapas virtuales específicos de tipos celulares y tejidos”, indica Pedro Martínez, investigador del CABD y uno de los autores del estudio.
Hasta ahora, las herramientas para predecir las estructuras 3R, asociadas al origen del cáncer, se basaban únicamente en la secuencia de ADN, la cual es esencialmente la misma en todo el organismo. Esta limitación impedía predecir la formación de híbridos en tipos celulares específicos. El nuevo método desarrollado supera este obstáculo al utilizar datos de secuenciación masiva, lo que permite generar mapas virtuales específicos para distintos tipos celulares y tejidos.
El estudio reveló una alta precisión de esta herramienta en las predicciones. Así, esta alta precisión del predictor hace posible anticipar los sitios de formación de híbridos de ADN y ARN sin necesidad de llevar a cabo los correspondientes experimentos de localización genómica, lo que puede facilitar el estudio de las bases moleculares de estas estructuras. Además, este estudio ha generado predicciones genómicas en 51 sistemas de mamíferos a partir de ENCODE, a las que la comunidad científica puede acceder fácilmente ayudando al resto de investigación a avanzar en su comprensión de la biología de estos sitios 3R asociados al origen del cáncer. “La alta precisión de nuestro predictor hace posible anticipar los sitios de formación de híbridos de ADN y ARN sin necesidad de llevar a cabo los correspondientes experimentos de localización genómica, lo que puede facilitar el estudio de las bases moleculares de estas estructuras”, culmina Pedro Martínez.
Referencia:
Thomas Vanhaeren, Ludovica Cataneo, Federico Divina, Pedro Manuel Martínez-García, Enhancing R-loop prediction with high-throughput sequencing data, NAR Genomics and Bioinformatics, Volume 7, Issue 2, June 2025, lqaf077, https://doi.org/10.1093/nargab/lqaf077
Fuente: Unidad Técnica de Comunicación UPO








