URV desarrolla PDB-CAT para analizar 250.000 estructuras de proteínas

¿Cuántas estructuras de proteínas se pueden analizar en pocas horas? Si alguna vez te has perdido entre miles de archivos en el Protein Data Bank, esta pregunta seguro que te ha rondado.

Un equipo de la Universidad Rovira i Virgili ha creado una herramienta que hace este trabajo casi haciendo magia digital. Pero no todo es tan sencillo como parece; el reto es enorme cuando hablamos de casi 250.000 estructuras.

L’eina PDB-CAT de la URV per analitzar ràpidament 250.000 estructures de proteïnes del Protein Data Bank
La herramienta PDB-CAT de la URV para analizar rápidamente 250.000 estructuras de proteínas del Protein Data Bank

La URV y el reto de organizar un tsunami de estructuras de proteínas

El Protein Data Bank (PDB) es una biblioteca gigante que almacena estructuras tridimensionales de proteínas y otras macromoléculas. Pero con un volumen que crece a pasos agigantados, ya supera las 250.000 estructuras.

¿La complicación? Muchas proteínas tienen decenas o incluso cientos de versiones, con diferentes ligandos o mutaciones. Elegir la correcta para la investigación se vuelve un rompecabezas digno de una escape room científica.

Pero no es solo un problema de cantidad. La información sobre si la unión del ligando a la proteína es covalente o no, o qué mutaciones presenta, a menudo no está clara en los datos. Esto hace que la tarea sea un lío monumental.

PDB-CAT, la respuesta automática

Para solucionarlo, un equipo del Grupo de Investigación en Quimioinformática y Nutrición de la URV ha creado PDB-CAT, un software que clasifica, analiza y extrae información clave de las estructuras de proteínas de manera automática.

Ariadna Llop Peiró, responsable principal del proyecto, explica que PDB-CAT detecta ligandos y la naturaleza de su unión, además de identificar mutaciones comparando con una secuencia de referencia proporcionada por el usuario.

Cómo PDB-CAT está revolucionando el diseño computacional de fármacos

Uno de los usos más destacados de esta herramienta ha sido el estudio de la proteasa principal del SARS-CoV-2, una molécula clave para la replicación del virus.

Gracias a PDB-CAT, el equipo ha podido clasificar todas las estructuras disponibles, detectar inhibidores y variantes, y así avanzar en la investigación de antivirales.

Eficiencia y accesibilidad

Said Trujillo de León, encargado de la implementación de la paralelización del programa, destaca que PDB-CAT puede procesar todo el contenido del PDB en pocas horas con un ordenador de sobremesa potente. Esto supone un antes y un después para proyectos que antes tardaban días o semanas.

Además, el software es de código abierto y público, con un tutorial que lo hace accesible tanto a expertos como a novatos.

Detalles técnicos e impacto científico

Funcionalidades destacadas de PDB-CAT

  • Clasificación automática de estructuras con o sin ligandos.
  • Detección de tipos de unión: covalente o no covalente.
  • Identificación de mutaciones mediante comparación con secuencias de referencia.
  • Ejecución paralela para acelerar el procesamiento de datos masivos.

Beneficios para la comunidad científica

PDB-CAT facilita el análisis y selección de datos entre cientos de miles de estructuras, ahorrando tiempo y reduciendo errores humanos. Esto es clave para la biología estructural y el desarrollo de fármacos.

Los investigadores pueden dedicar más tiempo a la innovación, y menos al aburrido procesamiento manual.

Aspecto Detalles
Número de estructuras analizadas Cerca de 250.000
Tiempo de análisis con PDB-CAT Pocas horas con un ordenador de sobremesa potente
Tipos de uniones detectadas Covalentes y no covalentes
Acceso Software libre y de código abierto

La realidad es que PDB-CAT marca un punto de inflexión en la manera en que la comunidad científica afronta la complejidad de los datos del Protein Data Bank.

Como señala Santiago Garcia Vallvé, investigador del Departamento de Bioquímica y Biotecnología de la URV, "esta herramienta es un paso adelante en la democratización del análisis estructural, haciéndolo más rápido y accesible".

Ariadna Llop Peiró añade que "la posibilidad de identificar rápidamente mutaciones y tipos de uniones acelerará el diseño de fármacos con mayor precisión".

En definitiva, un ejemplo de cómo la tecnología bien aplicada puede ser la mejor aliada de la ciencia.

Fuente del artículo: Universitat Rovira i Virgili