2.9. Importar fitxers JSON a MongoDB
Ara treballarem important un fitxer en format JSON que ens proporciona el navegador genòmic UCSC.
Descarreguem el fitxer JSON del següent enllaç:
https://api.genome.ucsc.edu/getData/track?genome=hg19;track=knownGene;chrom=chr1
Aquest fitxer conté la informació de tots els gens coneguts del cromosoma 1.
Baixem el fitxer i el guardem amb el nom hg19chr1.json
Per importar el fitxer a MongoDB obrim un nou terminal a la carpeta de la màquina virtual on hem guardat el fitxer i escrivim
mongoimport --db hg19 --collection chr1 --drop --file hg19chr1.json
Analitzarem aquesta instrucció:
L’ordre mongoimport
s’executa fora del client (mongo) i té diverses opcions o paràmetres
--db
indica la base de dades. Si existeix la utilitza per crear la col·lecció de documents, si no existeix la crea.--collection db
indica la col·lecció. Si existeix la utilitza per inserir-hi els documents del fitxer que importem, si no existeix la crea.--drop elimina
els documents previs de la col·lecció, si existeix.--file
indica el fitxer que importarem. Si els documents estiguessin dins d’un array hem d’afegir l’opció--jsonArray
Si ens connectem ara al servidor de MongoDB amb el client mongo i mirem les bases de dades amb show dbs
, veiem com s’ha creat la base de dades hg19.
Si ens connectem a la base de dades hg19 amb use hg19
i veiem les col·leccions amb show collections
podem veure la col·lecció chr1 que hem creat i ja podem treballar amb ella.