Un model integral per a les bases de dades de simulació molecular

Notícia | Recerca
(30/04/2025)

Més d’un centenar d’experts en simulació molecular han publicat un article a la revista Nature Methods per demanar un canvi de paradigma en la gestió de dades en dinàmica molecular.  El treball, liderat pel catedràtic de la Universitat de Barcelona Modesto Orozco i l’expert Adam Hospital, ambdós membres de l’Institut de Recerca Biomèdica (IRB Barcelona), proposa crear una infraestructura comuna per emmagatzemar i reutilitzar dades en el context de la revolució que representa la intel·ligència artificial.

Notícia | Recerca
30/04/2025

Més d’un centenar d’experts en simulació molecular han publicat un article a la revista Nature Methods per demanar un canvi de paradigma en la gestió de dades en dinàmica molecular.  El treball, liderat pel catedràtic de la Universitat de Barcelona Modesto Orozco i l’expert Adam Hospital, ambdós membres de l’Institut de Recerca Biomèdica (IRB Barcelona), proposa crear una infraestructura comuna per emmagatzemar i reutilitzar dades en el context de la revolució que representa la intel·ligència artificial.

En concret, l’article defensa la implementació dels principis FAIR (per l’anglès findable, accessible, interoperable, reusable) per millorar la reproductibilitat dels càlculs i facilitar-ne l’ús posterior com a font d’informació sobre la flexibilitat de les biomacromolècules.
​​​​​​​

Les simulacions computacionals han esdevingut una eina clau per estudiar el comportament de biomolècules al llarg del temps. Gràcies als supercomputadors, la dinàmica molecular (MD) permet observar aquests processos amb una gran precisió i aportar coneixements nous d’interès tant en recerca bàsica com en el disseny de biomolècules, des d’enzims fins a fàrmacs.

A diferència de la biologia estructural o la genòmica —disciplines en què guardar i compartir dades sota estàndards comuns és una pràctica habitual—, en el camp de la simulació molecular aquestes dades continuen fragmentades. A més, sovint acaben oblidades en ordinadors personals, fet que dificulta la reproductibilitat dels càlculs i n’impedeix l’aprofitament posterior. Això genera un problema destacable a l’hora d’integrar les dades en els fluxos de treball de la biologia estructural i de la biofísica, i frena el desenvolupament de mètodes d’intel·ligència artificial, l’entrenament dels quals és extremament dependent de l’accés a grans quantitats de dades dinàmiques.

Reutilitzar en lloc de repetir

Dissenyar un ecosistema obert i sostenible que multipliqui l’impacte d’aquestes dades i n’eviti duplicitats innecessàries és l’objectiu del nou article, signat per més d’un centenar d’investigadors de referència internacional, entre els quals alguns premis Nobel de química. Els autors demanen un canvi de model per aplicar els principis FAIR —que garanteixen que les dades siguin localitzables, accessibles, interoperables i reutilitzables— als resultats de les simulacions.

«La comunitat ha assumit durant anys que repetir una simulació era més fàcil i barat que arxivar-la. Però això ja no és cert», afirma el catedràtic de la Facultat de Química Modesto Orozco, coordinador del projecte europeu MDDB, cap del laboratori de Modelització Molecular i Bioinformàtica de l’IRB Barcelona i fundador de la biotecnològica Nostrum Biodiscovery.

«El coneixement que podem extreure de reutilitzar dades és enorme: ens permetrà identificar noves dianes, entrenar algorismes d’intel·ligència artificial o dissenyar nous experiments», afegeix l’investigador Adam Hospital. Orozco i Hospital lideren el projecte europeu MDDB, finançat pel programa Horitzó Europa de la Comissió Europea, adreçat a establir una base de dades centralitzada i accessible per a simulacions.
​​​​​​​

Més informació