La publicación New Nature Communications de Mann & Theis Group aprovecha los beneficios de las mediciones de sección transversal de péptidos de colisión (CCS) y el aprendizaje profundo de proteínas 4D.
Bruker Corporation anunció hoy una publicación insignia de los grupos de Matthias Mann y Fabian Theis en Nature Communications titulada «Aprendizaje profundo de las secciones transversales de colisión de un péptido con un valor experimental de un millón» por Florian Meyer et al. (doi.org/10.1038/s41467-021-21352-8) 1.
Figura 1. Mida la sección transversal del péptido de colisión (CCS) a escala utilizando TIMS y PASEF. De «Secciones transversales de colisión de aprendizaje profundo del péptido del universo de un valor experimental de un millón». (A) Flujo de trabajo de extracción de proteínas de células completas mediante digestión, fraccionamiento y cromatografía de cada fracción. El espectrómetro de masas TOF de cuadrupolo TIMS se ejecutó en modo PASEF. (B) Descripción general del conjunto de datos de CCS en este estudio por organismo. (C) Frecuencia de aminoácidos péptidos periféricos. (D) Frecuencia de aminoácidos péptidos periféricos. (E) Distribución de 559,979 puntos de datos únicos, incluida la secuencia modificada y el estado de carga, en el CCS frente al espacio m / z codificado por colores por estado de carga. Las distribuciones de intensidad de m / zy CCS se proyectan en los ejes superior y derecho, respectivamente. Los datos de origen se proporcionan como un archivo de datos de origen. Credito de imagen: Se utiliza Daltonex
El artículo de Nature Communications describe los valores de CCS medidos en timsTOF Pro como una propiedad principalmente intrínseca de los iones peptídicos, que se puede utilizar para mejorar la confianza en la identificación de grupos de péptidos y proteínas en proteínas de pistola 4D. Dado que la proteómica basada en espectrometría de masas se basa en una correspondencia precisa de los espectros adquiridos con una base de datos de secuencias de proteínas, los valores de CCS precisos ofrecen la ventaja de reducir la lista de candidatos. Esto es necesario para proteínas altamente sensibles, ya que los niveles bajos de señalización de péptidos deben medirse con precisión en una mezcla compleja, por ejemplo, en proteínas plasmáticas, peptidomas, péptidos inmunes o metaproteómicos.
La publicación resume un esfuerzo de investigación colaborativo dirigido por el profesor Matthias Mann, quien ocupa puestos duales en el Instituto Max Planck de Bioquímica en Martinsried, Alemania y el Centro de Investigación de Proteínas de la Fundación Novo Nordisk en la Universidad de Copenhague en Dinamarca, junto con una cohorte de El profesor Fabian Thies, quien también tiene cargos dobles en el Centro Helmholtz de Munich, en el Centro Alemán de Investigación para la Salud Ambiental y en el Departamento de Matemáticas de la Universidad de Munich, Alemania.
El autor principal, el Dr. Florian Meyer, ahora profesor asistente de proteómica funcional en el Hospital Universitario de Jena en Alemania, dijo: “La escala y precisión de los valores del péptido CCS en nuestros datos de timsTOF Pro fue suficiente para entrenar nuestro modelo de aprendizaje profundo para predecir con precisión los valores de CCS basándose únicamente en la secuencia de péptidos. Esta correlación entre los aminoácidos presentes en la secuencia de péptidos y la CCS medida tiene un enorme potencial para aumentar la confianza en la identificación de proteínas. Debido a que los valores de péptidos de CCS están completamente determinados por sus secuencias lineales de aminoácidos, deben ser predecibles con alta precisión y un modelo de aprendizaje profundo. El nuestro predice con precisión los valores de CCS incluso para péptidos previamente no observados Obtuvimos datos de la digestión proteolítica completa de cinco organismos, midiendo más de 2 millones de CCS valores, incluidos alrededor de 500.000 péptidos únicos, lo que lo convierte en un grupo Los datos de CCS más completos hasta la fecha.
El código fuente está disponible públicamente para que se puedan acelerar los desarrollos adicionales de los modelos de entrenamiento y la predicción del universo de péptidos humanos. Conceptualmente, nuestro modelo CCS puede hacer que dia-PASEF® Más rápido y económico al reducir el esfuerzo que implica la construcción de bibliotecas. Además, los valores de CCS previstos deberían permitir el uso de bibliotecas comunitarias, como la Pan Human Library, un depósito de más de 10.000 proteínas humanas, para la proteómica diana.
Profesor Matthias Mann
El profesor Fabian Thies declaró: “El aprendizaje profundo, en particular las redes neuronales recurrentes utilizadas, necesita muchas muestras para ser predictivo, así que me alegré mucho cuando Matthias se me acercó y pudimos predecir y cumplir conjuntamente las propiedades bioquímicas de los péptidos basados en su secuencia. Personalmente, me gustó mucho el hecho. Que, por lo tanto, también podemos atribuir los valores de CCS a muchos péptidos previamente no medidos «.
Este artículo presenta el enorme potencial de los valores CCS precisos para los métodos TIMS-PASEF en 4D-ProteomicsTM no sesgados y profundos. La robustez probada, el alto rendimiento y la sensibilidad superior de la plataforma TimsTOF son ideales para la investigación localizada. Los valores de péptidos CCS de amplio rango proporcionan una ventaja principal en la identificación de proteínas y la confianza en la cuantificación en la investigación de biomarcadores en estudios de cohortes grandes. Además, los beneficios de los valores CCS para mejorar la confianza en la identificación también se aplican a otros flujos de trabajo multómicos, como el metabolismo, los lípidos y los glicómicos. Estos son tiempos emocionantes para la comunidad de usuarios de TimsTOF en rápido crecimiento «.
Dr.. Gary Krupa, vicepresidente de Brooker, proteómica
«Solucionador de problemas profesional. Sutilmente encantador aficionado al tocino. Jugador. Ávido nerd del alcohol. Pionero de la música».