El grup de recerca Quimioinformàtica i Nutrició de la Universitat ha dissenyat un sistema d’aprenentatge automàtic que preveu mutacions recurrents dels coronavirus, una informació que permetrà avançar-se en el desenvolupament de fàrmacs.
Els virus són agents infecciosos que necessiten cèl·lules vives d’un hoste per reproduir-se. Quan infecten una cèl·lula, forcen els seus mecanismes reproductors a sintetitzar la informació genètica del propi virus. En el cas del SARS-CoV-2, les instruccions necessàries pel procés de reproducció estan contingudes al seu nucli en forma d’àcid ribonucleic (ARN). Mentre l’ADN humà presenta una estructura de doble hèlix, l’ARN està format per una sola cadena, que codifica la informació mitjançant quatre components: adenina, guanina, citosina i uracil. Quan existeixen errors en el procés de replicació —canvis en l’ordre en què es presenten aquestes quatre bases—apareixen les mutacions. Si bé es creia que aquests desordres en les cadenes d’ARN eren totalment aleatoris, recerques anteriors van detectar que hi havia errors més freqüents que d’altres. Més concretament, alguns enzims —substàncies orgàniques que catalitzen reaccions químiques— propis de l’hoste tendien a convertir la citosina de l’ARN del virus en uracil. En aquest context, el grup de recerca Quimioinformàtica i Nutrició de la URV, liderat pels investigadors Gerard Pujadas i Santi Garcia, ha dissenyat un sistema d’aprenentatge automàtic basat en una xarxa neuronal artificial que és capaç de predir les mutacions del virus, derivades del contacte de la informació genètica amb certs enzims de l’hoste.
Un cop analitzada l’evolució del virus tenint en compte les seves mutacions, el doctorand de la URV Bryan Saldivar, va “entrenar” una xarxa neuronal artificial amb dades de més de 800.000 genomes del virus per tal que aquesta aprengués a predir quines mutacions recurrents es donarien de cara al futur. Una xarxa neuronal artificial és un sistema computacional d’aprenentatge automàtic que connecta múltiples nodes anomenats neurones artificials que, quan s’entrenen per dur a terme una tasca en particular, son capaces de treballar conjuntament per processar grans volums de dades. Aquests sistemes aprenen per si sols i poden modelar-se a sí mateixos per aconseguir un determinat resultat, a petició dels investigadors.
Típicament, el procediment consisteix en utilitzar una part del genoma per crear la xarxa i reservar-ne una part, suficientment àmplia, per testejar-la i corregir-ne el funcionament si fos necessari. En aquest cas, l’equip va reservar quatre gens, un dels quals conté la informació de la proteïna que permet al virus entrar a les cèl·lules per infectar-les, per tal de focalitzar l’estudi en aquesta direcció.
Aquest sistema, que no s’havia aplicat mai en la predicció de mutacions del virus, ha permès als investigadors avançar-se als canvis recurrents del virus, catalitzats pels enzims propis del cos humà. El sistema també identifica aquelles parts del virus que no poden canviar, ja que si ho fan l’agent infecciós és incapaç de reproduir-se.
Tota aquesta informació permetria als investigadors, d’una banda, avançar-se en el disseny de fàrmacs i, de l’altra, fer-los més efectius de cara a l’eliminació del virus, utilitzant les debilitats detectades per dificultar-ne la reproducció. “Aquesta recerca aporta informació rellevant per a la comunitat científica, i queda aquí per a què es pugui consultar”, explica Santi Garcia. També considera que la metodologia és replicable en futures pandèmies, especialment si les causa un coronavirus o una nova variant del SARS-CoV-2.