Investigadores mapean mutaciones causantes de cáncer en todo el genoma humano

En un estudio reciente publicado en biotecnología de la naturalezaEn el estudio, los investigadores exploraron las causas del cáncer mediante el mapeo de las tasas de mutaciones somáticas en el genoma humano.

estancia: El mapeo de todo el genoma de las tasas de mutación somática revela los impulsores del cáncer. Crédito de la imagen: peterschreiber.media/Shutterstock

antecedentes

Para entender el cáncer, es necesario identificar las mutaciones que conducen al cáncer. Si bien se está realizando una amplia investigación para comprender lo mismo, la mayoría de los estudios se centran en elementos no codificantes específicos y secuencias de codificación de proteínas debido a la dificultad de modelar las tasas de mutaciones somáticas que se encuentran en diferentes genomas tumorales.

sobre estudiar

En este estudio, los investigadores describieron un modelo de tasa de mutación de todo el genoma llamado Dig que permitió una prueba rápida de la presencia de mutaciones impulsoras seleccionadas en el genoma.

El equipo diseñó el modelo Dig para representar las tasas de mutaciones somáticas a nivel del genoma para cualquier tipo de cáncer dado para permitir la evaluación oportuna de mutaciones excesivas en cualquier parte del genoma. Esto permitió una distribución equitativa de mutaciones neutras en un conjunto de loci genómicos para un grupo de tumores de este tipo de cáncer en particular.

El modelo utilizó un enfoque de aprendizaje profundo probabilístico que capturó dos determinantes centrales de la variación en las tasas de mutación somática: (i) la variación de kilobases, que está influenciada por características epigenéticas que incluyen la accesibilidad a la cromatina y el tiempo de replicación que influyen en la eficacia del ácido desoxirribonucleico (ADN) y (ii) La variabilidad del par de bases está influenciada por los sesgos del contexto de secuencia de los procesos que inducen mutaciones somáticas, incluida la catálisis de la enzima de edición de ARNm de apoproteína B (APOBEC) de la inactivación de aminocitidina impulsada por polipéptidos, así como la exposición a la luz ultravioleta (UV).

READ  El experimento resuelve el debate de larga data sobre la evolución, al menos en E. coli

Luego, el equipo construyó mapas de las tasas de mutación y los sesgos de mutación de nucleótidos inferidos para un total de 37 tipos de cáncer de acuerdo con las mutaciones somáticas registradas en el Pan-Cancer Analysis of the Whole Genome Data Set (PCAWG). También se estimaron las tasas de mutación y los sesgos inferidos para 723 marcadores de cromatina en 111 tejidos según lo registrado en la epigenómica de la hoja de ruta. La precisión de la tasa de mutación somática se midió adicionalmente utilizando una escala de relación de varianza.

El equipo también aplicó el modelo Dig para cuantificar el tamaño en el que se ubican los SNV de empalme de codificación redundantes en comparación con la tasa de mutación y para evaluar su papel como impulsor del cáncer. El efecto de los indels en las expresiones génicas y la subsiguiente inactivación de los polimorfismos de unión a factores de transcripción se evaluó mediante la búsqueda de promotores en el conjunto de datos de PCAWG.

consecuencias

Los resultados del estudio mostraron que el modelo Dig estimó con precisión que la variación en las tasas de variantes de un solo nucleótido (SNV) fue una media del 77,3 % en la región de 10 kb y del 94,6 % en la región de 1 Mb en un total de 16 tipos de cáncer. La mayor variación en las SNV ubicadas en regiones de 10 kb se observó en 14 de los 16 grupos de cáncer. Por otro lado, los 16 grupos de cáncer informaron una variación alta de SNV no sinónimo y 15 tenían un ARN no codificante alto.

READ  Nuevo estudio de ADN muestra que el cambio climático acabó con los mamuts

Además, el modelo Dig igualó o incluso superó el rendimiento mostrado por otros métodos adaptados a clases específicas de elementos en todo el genoma o muestras de genoma completo. Dig también obtuvo la puntuación más alta en F1 como 24 de los 32 grupos PCAWG evaluados, y también resultó ser el más fuerte entre los 14 grupos en términos de detección de genes impulsores basados ​​en la carga. El equipo también notó que Dig identificó impulsores potenciales de una a cinco veces más rápido que los métodos convencionales para cada componente y grupo probado.

La reducción del tamaño de los elementos analizados para incluir decenas a cientos de loci dio como resultado un aumento de ~20 % en la potencia con la que se identificaron las mutaciones motoras en menos del 1 % de las muestras analizadas. El equipo también descubrió que el empalme de los SNV codificados a partir de genes supresores de tumores (TSG) registrados en la población de genes del cáncer (CGC) ocurría con más frecuencia de lo esperado en condiciones neutrales. Los SNV codificados en intrones se enriquecieron y sesgaron para que fueran incidentales en sitios con un gran efecto esperado en el empalme. En general, las SNV de unión intrónica representaron alrededor del 4,5 % de las SNV redundantes presentes en los TSG. El equipo también notó que el promotor TP53 era el único elemento que mostraba una carga significativa de indeles en todo el genoma.

conclusión

En general, los resultados del estudio destacaron la utilidad de Dig como herramienta para estudios in vivo e in vitro debido a su capacidad para priorizar grupos específicos de mutaciones que son impulsores potenciales en los genomas codificantes y no codificantes. Los investigadores creen que el enfoque de aprendizaje profundo utilizado en el estudio actual podría mejorar la utilidad experimental, computacional y clínica de los datos de secuenciación relacionados con el genoma del cáncer.

READ  La IA puede aprender patrones del lenguaje humano

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *