DOMINO, una nova aplicació bioinformàtica per facilitar estudis de la diversitat genètica al llarg de tot el genoma
Dissenyar tècniques per explorar la diversitat genètica mitjançant nous marcadors moleculars és un desafiament constant per al progrés de la recerca en filogenètica, i en especial, per conèixer la variació genòmica en organismes no considerats com a models clàssics dʼestudi. Lʼestudi del genoma complet a gran escala està obrint noves perspectives sobre la complexitat biològica dels organismes, i respon a una autèntica revolució metodològica per poder integrar un gran volum de dades en moltes disciplines científiques.
Dissenyar tècniques per explorar la diversitat genètica mitjançant nous marcadors moleculars és un desafiament constant per al progrés de la recerca en filogenètica, i en especial, per conèixer la variació genòmica en organismes no considerats com a models clàssics dʼestudi. Lʼestudi del genoma complet a gran escala està obrint noves perspectives sobre la complexitat biològica dels organismes, i respon a una autèntica revolució metodològica per poder integrar un gran volum de dades en moltes disciplines científiques.
Facilitar la identificació i selecció de marcadors moleculars distribuïts al llarg del genoma dʼorganismes model i no model és una de les principals aplicacions de DOMINO (Development Of Molecular markers In Non-model Organisms), una innovadora eina bioinformàtica que es presenta en un article publicat a la revista Bioinformatics, dʼOxford University Press, i que signen els experts Julio Rozas, Cristina Frías, José Francisco Sánchez, Sara Guirao i Alejandro Sánchez, del Departament de Genètica, Microbiologia i Estadística i de lʼInstitut de Recerca de la Biodiversitat (IRBio) de la Universitat de Barcelona, i Elisa Mora i Miquel A. Arnedo, del Departament de Biologia Evolutiva, Ecologia i Ciències Ambientals i de lʼIRBio.
Superant barreres en lʼestudi del genoma a gran escala
Tenir la possibilitat dʼidentificar nous marcadors o seleccionar els més adients entre un conjunt de marcadors existents és un pas previ en el treball científic de molts investigadors, per exemple, en els estudis de filogenòmica o filogeografia molecular que fan servir dades de seqüenciació massiva de lʼADN, conegudes com a dades de seqüenciació de nova generació (NGS). «De fet, avui en dia, disposar de molts marcadors moleculars esdevé un autèntic coll dʼampolla en moltes recerques», assenyala el catedràtic Julio Rozas, director del Grup de Recerca de Genòmica Evolutiva i Bioinformàtica a la Universitat de Barcelona, integrat en la plataforma Bioinformatics Barcelona (BIB).
«DOMINO és una aplicació bioinformàtica molt útil per a investigadors que fan servir tant organismes model com no model», explica Rozas. No obstant això, els organismes no model mostren més dificultats per desenvolupar marcadors moleculars: «Com que no seʼn coneix la seqüencia genòmica, resulta molt més difícil disposar dʼun nombre suficient dʼaquests marcadors», detalla Rozas.
DOMINO: de la filogènia molecular i la filogenòmica a la genòmica de poblacions
En comparació amb altres aplicacions informàtiques, DOMINO combina una alta flexibilitat —permet fer servir el programari amb una gran diversitat de tipus de dades dʼNGS— amb la facilitat dʼús mitjançant una interfície gràfica dʼusuari (GUI); dʼaquesta manera, investigadors sense grans coneixements bioinformàtics poden emprar el programari.
DOMINO és una eina informàtica de potencial interès per impulsar la recerca en el camp de la filogènia molecular i la filogenòmica (estudi de les relacions evolutives de diverses espècies properes), la filogeografia (estudi dels factors demogràfics i selectius responsables de la distribució actual de les espècies), i en genètica i genòmica de poblacions (determinació dels gens i les regions genòmiques afectades per diferents mecanismes evolutius, incloent-hi els processos demogràfics i selectius).
El treball científic per desenvolupar DOMINO, que han coordinat els professors Julio Rozas, Miquel Àngel Arnedo i Alejandro Sánchez-Gracia, constata un cop més la necessitat de desenvolupar aplicacions bioinformàtiques versàtils que es puguin adaptar a la gran velocitat de progressió de les tecnologies de seqüenciació dʼADN i a la seva aplicació en estudis evolutius.
«En el futur, esperem que DOMINO també pugui emprar dades dʼNGS de noves tecnologies —actualment fa ús de seqüencies dʼADN de plataformes com 454 o Illumina—, a més de treballar amb informació proporcionada per noves aplicacions experimentals, derivades dels anomenats RADseq o dʼaltres estratègies basades en la seqüenciació dʼuna part representativa del genoma», explica Julio Rozas, que és el primer autor dʼun altre article publicat el 2003 a la revista Bioinformatics sobre un potent programari bioinformàtic per analitzar els polimorfismes de lʼADN, que va ser el treball més citat a Espanya —amb 1.815 citacions— durant el període 1999-2009, segons dades de lʼEssential Science Indicators.