2. Bases de dades NoSQL

2.9. Importar fitxers JSON a MongoDB

Ara treballarem important un fitxer en format JSON que ens proporciona el navegador genòmic UCSC.

Descarreguem el fitxer JSON del següent enllaç:
https://api.genome.ucsc.edu/getData/track?genome=hg19;track=knownGene;chrom=chr1

Aquest fitxer conté la informació de tots els gens coneguts del cromosoma 1.

Baixem el fitxer i el guardem amb el nom hg19chr1.json

Per importar el fitxer a MongoDB obrim un nou terminal a la carpeta de la màquina virtual on hem guardat el fitxer i escrivim

mongoimport --db hg19 --collection chr1 --drop --file hg19chr1.json

Analitzarem aquesta instrucció:

L’ordre mongoimport s’executa fora del client (mongo) i té diverses opcions o paràmetres

  • --db indica la base de dades. Si existeix la utilitza per crear la col·lecció de documents, si no existeix la crea.
  • --collection db indica la col·lecció. Si existeix la utilitza per inserir-hi els documents del fitxer que importem, si no existeix la crea.
  • --drop elimina els documents previs de la col·lecció, si existeix.
  • --file indica el fitxer que importarem. Si els documents estiguessin dins d’un array hem d’afegir l’opció --jsonArray

Si ens connectem ara al servidor de MongoDB amb el client mongo i mirem les bases de dades amb show dbs, veiem com s’ha creat la base de dades hg19.

Si ens connectem a la base de dades hg19 amb use hg19 i veiem les col·leccions amb show collections podem veure la col·lecció chr1 que hem creat i ja podem treballar amb ella.