URV desenvolupa PDB-CAT per analitzar 250.000 estructures de proteïnes

Quantes estructures de proteïnes es poden analitzar en poques hores? Si alguna vegada t'has perdut entre milers de fitxers al Protein Data Bank, aquesta pregunta segur que t'ha rondat.

Un equip de la Universitat Rovira i Virgili ha creat una eina que et fa aquesta feina gairebé fent màgia digital. Però no tot és tan senzill com sembla; el repte és majúscul quan parlem de gairebé 250.000 estructures.

L’eina PDB-CAT de la URV per analitzar ràpidament 250.000 estructures de proteïnes del Protein Data Bank
L’eina PDB-CAT de la URV per analitzar ràpidament 250.000 estructures de proteïnes del Protein Data Bank

La URV i el repte d'organitzar un tsunami d'estructures de proteïnes

El Protein Data Bank (PDB) és una biblioteca gegant que guarda estructures tridimensionals de proteïnes i altres macromolècules. Però amb un volum que creix a passos de gegant, ja supera les 250.000 estructures.

La complicació? Moltes proteïnes tenen desenes o fins i tot centenars de versions, amb diferents lligands o mutacions. Triar la correcta per a la recerca esdevé un trencaclosques digne d'un escape room científic.

Però no és només un problema de nombre. La informació sobre si la unió del lligand a la proteïna és covalent o no, o quines mutacions presenta, sovint no està clara en les dades. Això fa que la tasca sigui un embolic monumental.

PDB-CAT, la resposta automàtica

Per solucionar-ho, un equip del Grup de Recerca en Quimioinformàtica i Nutrició de la URV ha creat PDB-CAT, un programari que classifica, analitza i extreu informació clau de les estructures de proteïnes de manera automàtica.

Ariadna Llop Peiró, responsable principal del projecte, explica que PDB-CAT detecta lligands i la naturalesa de la seva unió, a més d'identificar mutacions comparant amb una seqüència de referència proporcionada per l'usuari.

Com PDB-CAT està revolucionant el disseny computacional de fàrmacs

Un dels usos més destacats d'aquesta eina ha estat l'estudi de la proteasa principal del SARS-CoV-2, una molècula clau per a la replicació del virus.

Gràcies a PDB-CAT, l'equip ha pogut classificar totes les estructures disponibles, detectar inhibidors i variants, i així avançar en la recerca d'antivirals.

Eficiència i accessibilitat

Said Trujillo de León, encarregat de la implementació de la paral·lelització del programa, destaca que PDB-CAT pot processar tot el contingut del PDB en poques hores amb un ordinador de sobretaula potent. Això suposa un abans i un després per a projectes que abans trigaven dies o setmanes.

A més, el programari és de codi obert i públic, amb un tutorial que el fa accessible tant a experts com a novells.

Detalls tècnics i impacte científic

Funcionalitats destacades de PDB-CAT

  • Classificació automàtica d'estructures amb o sense lligands.
  • Detecció de tipus d'unió: covalent o no covalent.
  • Identificació de mutacions mitjançant comparació amb seqüències de referència.
  • Execució paral·lela per accelerar processament de dades massives.

Beneficis per a la comunitat científica

PDB-CAT facilita l'anàlisi i selecció de dades entre centenars de milers d'estructures, estalviant temps i reduint errors humans. Això és clau per a la biologia estructural i el desenvolupament de fàrmacs.

Els investigadors poden dedicar més temps a la innovació, i menys a l’avorrit processament manual.

AspecteDetalls
Nombre d’estructures analitzadesProp de 250.000
Temps d’anàlisi amb PDB-CATPoques hores amb un ordinador de sobretaula potent
Tipus d’unions detectadesCovalents i no covalents
AccésProgramari lliure i de codi obert

La realitat és que PDB-CAT marca un punt d'inflexió en la manera com la comunitat científica s'enfronta a la complexitat de les dades del Protein Data Bank.

Com assenyala Santiago Garcia Vallvé, investigador del Departament de Bioquímica i Biotecnologia de la URV, "aquesta eina és un pas endavant en la democratització de l'anàlisi estructural, fent-la més ràpida i accessible".

Ariadna Llop Peiró afegeix que "la possibilitat d'identificar ràpidament mutacions i tipus d'unions accelerarà el disseny de fàrmacs amb més precisió".

Tot plegat, un exemple de com la tecnologia ben aplicada pot ser la millor aliada de la ciència.

Font de l'article: Universitat Rovira i Virgili