Introducció als entorns de treball Gnu/Linux

La seqüència del genoma de múltiples espècies està a disposició de qualsevol persona que posseeixi un ordinador amb connexió a Internet, gràcies a l’enorme esforç de la comunitat científica, cohesionada en diversos consorcis internacionals, públics i privats. Els grans projectes de seqüenciació han produït una voluminosa quantitat d’informació genòmica que ha de ser gestionada de forma extremadament eficient i precisa per a la seva posterior anàlisi. Només la seqüència de nucleòtids del genoma humà, que ocupa diversos gigabytes, conté desenes de milers de gens i reguladors transcripcionals. De fet, la recent aparició de nous mètodes de seqüenciació massiva per cartografiar la localització de diferents elements funcionals al llarg de les seqüències genòmiques en qualsevol context cel·lular multiplicarà exponencialment els requisits actuals de temps de càlcul i espai d’emmagatzematge.

L’anàlisi exhaustiva de tota aquesta informació per extreure’n nou coneixement no es pot realitzar manualment. La gestió informàtica resulta essencial, per tant, per manipular amb garanties aquest volum de dades. La bioinformàtica proporciona, en aquest sentit, l’entorn ideal de treball per al biòleg molecular. En un entorn bioinformàtic de recerca, els genomes i les aplicacions estan emmagatzemats localment, evitant problemes de connexió i trànsit de la xarxa. Aquestes estacions de treball són les eines essencials de l’investigador per efectuar anàlisis bioinformàtiques de qualsevol mena de seqüència biològica.

Aquest mòdul aprofundeix sobre la majoria d’aplicacions computacionals utilitzades habitualment per un bioinformàtic per processar informació genòmica. La família de sistemes operatius GNU/Linux és la plataforma habitual de treball en aquesta classe de laboratoris. En primer lloc, farem una introducció general als conceptes bàsics relacionats amb els sistemes operatius. Posteriorment, enfocarem el nostre interès en el maneig del terminal de GNU/Linux, l’eina de treball usual per a un bioinformàtic. Aprendrem les ordres bàsiques, i com poden combinar-se per generar ordres encara més potents que conformin protocols complets de treball. Finalment, veurem que podem obtenir fàcilment una còpia dels grans conjunts de dades biològiques de referència per poder analitzar-les localment al nostre ordinador amb summa facilitat. En resum, dominareu els elements bàsics de treball per integrar-vos fàcilment dins de qualsevol entorn de recerca bioinformàtic.