La URV crea una nova eina per analitzar milers d’estructures de proteïnes i accelerar la recerca de fàrmacs

El programari PDB-CAT permet classificar i analitzar dades del Protein Data Bank en poques hores

10 de març de 2026 a les 18:48h

Un equip del Grup de Recerca en Quimioinformàtica i Nutrició de la Universitat Rovira i Virgili (URV) ha desenvolupat PDB-CAT, una nova eina informàtica permet analitzar, classificar i extreure informació clau de les estructures tridimensionals de proteïnes dipositades al Protein Data Bank (PDB), una de les bases de dades de referència de la comunitat investigadora internacional en biologia estructural.

El PDB recull estructures tridimensionals de proteïnes, àcids nucleics i altres macromolècules biològiques obtingudes experimentalment. Aquestes estructures són fonamentals per entendre com funcionen les proteïnes, com reconeixen i interaccionen amb altres molècules i com es poden dissenyar fàrmacs capaços de modular-ne l’activitat.

Des de la seva creació, el volum de dades del Protein Data Bank ha crescut de manera ràpida i continuada. El dia d'avui ja compta amb prop de 250.000 estructures, i continua augmentat amb milers d’entrades noves cada any. Aquesta allau d’informació, tot i ser un gran actiu per a la recerca, planteja dificultats pràctiques a l’hora de trobar i seleccionar de manera eficient quines estructures són realment útils per a una recerca concreta dins d’un volum de dades tan immens, especialment en projectes de disseny computacional de fàrmacs.

En molts casos, “una mateixa proteïna pot tenir desenes o centenars d’estructures disponibles al PDB. Aquestes poden diferir en si la proteïna està sola o unida a un lligand -una molècula-, en el tipus d’unió —covalent o no covalent— o en la presència de mutacions respecte a la seqüència considerada de referència, per exemple” explica Ariadna Llop Peiró, estudiant de doctorat del Departament de Bioquímica i Biotecnologia de la URV i l’encarregada principal del desenvolupament del programa. “Quan volem utilitzar aquestes estructures en projectes de disseny computacional de fàrmacs, cal analitzar quines existeixen, en què es diferencien i quines són adients per a l’objectiu del projecte. Fer-ho manualment és lent, propens a errors i poc viable quan el nombre d’estructures és tan elevat”, afegeix.

PDB-CAT s’ha dissenyat precisament per donar resposta a aquest repte. L’eina permet detectar de manera automàtica si una estructura conté un lligand unit a la proteïna, determinar si aquesta unió és covalent o no covalent —una informació clau en el desenvolupament de fàrmacs que sovint no està explícitament indicada als fitxers del PDB— i identificar possibles mutacions a la seqüència de la proteïna mitjançant la comparació amb una seqüència de referència proporcionada pels usuaris.

Santiago Garcia Vallvé i Aleix Gimeno, investigadors del Departament de Bioquímica i Biotecnologia de la URV
Santiago Garcia Vallvé i Aleix Gimeno, investigadors del Departament de Bioquímica i Biotecnologia de la URV

 

Menys temps d’anàlisi, més temps per a la recerca

Una de les principals fortaleses del programari és la seva eficiència. PDB-CAT està paral·lelitzat, i això fa que es pugui executar simultàniament en diversos processadors d’un mateix ordinador i reduir de manera significativa el temps d’anàlisi de grans conjunts d’estructures. Gràcies a aquesta optimització, “és possible analitzar tot el contingut actual del PDB en poques hores amb un ordinador de sobretaula equipat amb una CPU potent, i això que converteix aquesta nova eina en un recurs especialment útil per a projectes de disseny computacional de fàrmacs”, apunta Said Trujillo de León, estudiant del doble grau en Enginyeria Informàtica i en Biotecnologia, que ha estat l’encarregat de la implementació de la paral·lelització del programa.

Per comprovar el potencial de PDB-CAT, aquest nou programari s’ha aplicat a l’anàlisi de totes les estructures disponibles de la proteasa principal del SARS-CoV-2, un enzim essencial per a la replicació del virus i una de les principals dianes en la recerca de nous antivirals. Mitjançant aquesta eina, el grup de recerca ha pogut classificar sistemàticament les estructures, identificar quines contenen inhibidors, determinar si la unió és covalent o no covalent i detectar mutacions i variants de la proteïna, una informació clau per avançar en el disseny racional de nous compostos.

L’equip investigador també destaca que PDB-CAT és un programari lliure i de codi obert, disponible públicament a GitHub, i va acompanyat d’un tutorial detallat que en facilita l’ús tant a investigadors experts com a usuaris menys familiaritzats amb la programació.

Sobre l'autor
C CIUTAT
Redacció
Veure biografia
El més llegit