El machine learning de Google puede ayudar a descubrir nuevos anticuerpos

islita

La subsidiaria de Alphabet (la empresa matriz de Google), DeepMind, ha demostrado que el aprendizaje automático puede predecir la forma de la maquinaria de proteínas con una precisión inusual y puede ayudar a descubrir nuevos anticuerpos, enzimas y alimentos.

La subsidiaria de Alphabet (la empresa matriz de Google), DeepMind, ha demostrado que Machine Learning (ML) puede predecir la forma de la maquinaria de proteínas con una precisión sin precedentes, allanando el camino para que los investigadores descubran nuevos anticuerpos, enzimas y alimentos.


Banner_frasco-suscripcion-800x250

La forma de una proteína proporciona pistas muy sólidas sobre cómo se puede usar la maquinaria de la proteína, pero no resuelve completamente esta pregunta.

«Así que nos preguntamos: ¿podemos predecir qué función realiza una proteína?» dijo Max Bileschi, ingeniero de software del personal, Google Research, Brain Team.

En un artículo de Nature Biotechnology, Google describió cómo las redes neuronales pueden revelar de manera confiable la función de la «materia oscura» del universo de las proteínas, superando a los métodos más avanzados.

DeepMind trabajó en estrecha colaboración con expertos reconocidos internacionalmente en el Instituto Europeo de Bioinformática de EMBL (EMBL-EBI) para anotar 6,8 millones de regiones de proteínas más en el lanzamiento de la base de datos ‘Pfam v34.0’, un repositorio global para familias de proteínas y su función.

Estas anotaciones superan la expansión de la base de datos durante la última década y permitirán a los 2,5 millones de investigadores de ciencias biológicas de todo el mundo descubrir nuevos anticuerpos, enzimas, alimentos y tratamientos.

Para alrededor de un tercio de todas las proteínas que producen todos los organismos, simplemente no sabemos lo que hacen.

«Es como si estuviéramos en una fábrica donde todo está zumbando y estamos rodeados de todas estas herramientas impresionantes, pero solo tenemos una vaga idea de lo que está pasando. Entender cómo funcionan estas herramientas y cómo podemos usarlas , es donde creemos que el aprendizaje automático puede marcar una gran diferencia», dijo Lucy Colwell, investigadora científica sénior de Google Research, Brain Team.

La base de datos Pfam es una gran colección de familias de proteínas y sus secuencias.

«Nuestros modelos ML ayudaron a anotar 6,8 millones de regiones de proteínas más en la base de datos», dijeron los investigadores.

La compañía también lanzó un artículo científico interactivo en el que «puede jugar con nuestros modelos ML y obtener resultados en tiempo real, todo en su navegador web, sin necesidad de configuración».

Según los investigadores, la combinación de modelos profundos con métodos existentes mejora significativamente la detección de homología remota, lo que sugiere que los modelos profundos aprenden información complementaria.

Este enfoque amplía la cobertura de Pfam en más del 9,5 %, superando las adiciones realizadas durante la última década, y predice la función de 360 ​​proteínas de proteoma humano de referencia sin anotación previa de Pfam.

«Los resultados sugieren que los modelos de aprendizaje profundo serán un componente central de las futuras herramientas de anotación de proteínas».
Banner_azules
Reciba las últimas noticias de la industria en su casilla:

Suscribirse ✉