Els fitxers són les unitats lògiques d’informació persistent dins d’un ordinador. Com que manquen d’estructura pròpia, és el programador qui estableix com organitzar la informació en el seu interior (per exemple, fitxers FASTA, XML o JSON).
Mitjançant les ordres apropiades del terminal o línia d’ordres, podem analitzar el contingut dels fitxers d’una manera relativament eficient i còmode. En el mòdul «Introducció als entorns de treball GNU/Linux» hem treballat amb ordres del terminal per gestionar la informació emmagatzemada en fitxers de text que contenen anotacions biològiques. Tanmateix, quan el volum d’informació excedeix certs límits, com és el cas de l’anotació completa d’un genoma, i s’incrementa el nombre de persones involucrades en un projecte de recerca, cal organitzar i estructurar la informació en una base de dades i gestionar-la utilitzant un programa especialitzat, també anomenat Sistema de Gestió de Bases de Dades (SGBD).
Un SGBD és l’eina idònia per administrar eficientment elevades quantitats de registres o dades. La responsabilitat sobre la gestió i els formats interns de les dades correspon al sistema, la qual cosa allibera el propi usuari d’aquestes tasques.
Amb un sistema de gestió de la informació tindrem a la nostra disposició un conjunt d’eines i instruccions que ens permetran extreure nou coneixement de tota aquesta informació.
En aquest mòdul veurem dos models de gestió de les dades, el model relacional basat en el llenguatge SQL, i utilitzarem el SGBD MySQL, i el model no relacional, també anomenat NoSQL, i utilitzarem el SGBD MongoDB basat en col·leccions de documents.