{"id":348,"date":"2023-09-01T10:49:42","date_gmt":"2023-09-01T08:49:42","guid":{"rendered":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/?page_id=348"},"modified":"2025-03-07T18:06:45","modified_gmt":"2025-03-07T16:06:45","slug":"1-17-2-descarga-y-exploracion-del-genoma-humano","status":"publish","type":"page","link":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/1-17-2-descarga-y-exploracion-del-genoma-humano\/","title":{"rendered":"1.17.2. Descarga y exploraci\u00f3n del genoma humano"},"content":{"rendered":"<p>La organizaci\u00f3n del genoma de un organismo se da en un conjunto de cromosomas. En este ejemplo, se procede a descargar la anotaci\u00f3n sobre los cromosomas del genoma humano en su distribuci\u00f3n <em>hg38<\/em>. Se adjunta la tabla 18 con los accesos de descarga que se van a utilizar.<\/p>\n<div class=\"tabletitle\"><p>Tabla 18. P\u00e1ginas web del navegador gen\u00f3mico UCSC.<\/p>\n<\/div>\n<table width=\"603\">\n<tbody>\n<tr class=\"table-header\">\n<td width=\"238\">Acceso<\/td>\n<td width=\"365\">Direcci\u00f3n<\/td>\n<\/tr>\n<tr>\n<td width=\"238\">P\u00e1gina principal servidor UCSC<\/td>\n<td width=\"365\"><a href=\"http:\/\/genome.ucsc.edu\/\" target=\"_blank\" rel=\"noopener\">http:\/\/genome.ucsc.edu\/<\/a><\/td>\n<\/tr>\n<tr>\n<td width=\"238\">P\u00e1gina descargas (genoma data)<\/td>\n<td width=\"365\"><a href=\"https:\/\/hgdownload.soe.ucsc.edu\/downloads.html\" target=\"_blank\" rel=\"noopener\">https:\/\/hgdownload.soe.ucsc.edu\/downloads.html<\/a><\/td>\n<\/tr>\n<tr>\n<td width=\"238\">P\u00e1gina listado especies<\/td>\n<td width=\"365\"><a href=\"https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/currentGenomes\/\" target=\"_blank\" rel=\"noopener\">https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/currentGenomes\/<\/a><\/td>\n<\/tr>\n<tr>\n<td width=\"238\">P\u00e1gina acceso especie <em>human<\/em><\/td>\n<td width=\"365\"><a href=\"https:\/\/hgdownload.soe.ucsc.edu\/downloads.html#human\" target=\"_blank\" rel=\"noopener\">https:\/\/hgdownload.soe.ucsc.edu\/downloads.html#human<\/a><\/td>\n<\/tr>\n<tr>\n<td width=\"238\">P\u00e1gina acceso especie <em>human<\/em><\/td>\n<td width=\"365\"><a href=\"https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/\" target=\"_blank\" rel=\"noopener\">https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/<\/a><\/td>\n<\/tr>\n<tr>\n<td width=\"238\">P\u00e1gina <em>Sequence data by Chromosome<\/em><\/td>\n<td width=\"365\"><a href=\"https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/chromosomes\/\" target=\"_blank\" rel=\"noopener\">https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/chromosomes\/<\/a><\/td>\n<\/tr>\n<tr>\n<td width=\"238\">P\u00e1gina acceso <em>bigZips<\/em><\/td>\n<td width=\"365\"><a href=\"https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/bigZips\/\" target=\"_blank\" rel=\"noopener\">https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/bigZips\/<\/a><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<div class=\"tablefooter\"><p>Fuente: elaboraci\u00f3n propia.<\/p>\n<\/div>\n<p>Primeramente, se accede a la p\u00e1gina de descargas (en ingl\u00e9s, <em>downloads<\/em>) del navegador gen\u00f3mico UCSC (<a href=\"https:\/\/hgdownload.soe.ucsc.edu\/downloads.html\" target=\"_blank\" rel=\"noopener\">https:\/\/hgdownload.soe.ucsc.edu\/downloads.html<\/a>).<\/p>\n<p>El contenido de esta p\u00e1gina nos muestra el listado de genomas disponibles organizado por especies. A fecha de 26 de abril de 2023 existen informaci\u00f3n sobre 108 especies.<\/p>\n<p>Al hacer uso del enlace <em>Human<\/em>, entramos a la secci\u00f3n dedicada al genoma humano. Es importante destacar que la informaci\u00f3n correspondiente a cada genoma se actualiza con cierta frecuencia, por lo que cada mejora sustancial cuenta con un c\u00f3digo de versi\u00f3n propio. En este caso, trabajaremos con la distribuci\u00f3n conocida como <em>hg38<\/em>, la cual es la m\u00e1s reciente al momento de la redacci\u00f3n de estos materiales.<\/p>\n<p>Si desde la p\u00e1gina de acceso a la especie humana acced\u00e9is al enlace asociado a <em>Sequence data by chromosome<\/em> (<a href=\"https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/chromosomes\" target=\"_blank\" rel=\"noopener\">https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/chromosomes<\/a>) acceder\u00e9is al listado de los ficheros comprimidos FASTA de cada uno de los cromosomas (chr*.fa.gz), a la secuencias <em>random<\/em>, que son secuencias no colocadas en los anteriores cromosomas de referencia (chr*_random), y a las secuencia <em>chrUn_*<\/em>, que son secuencias no localizadas en las que el cromosoma de referencia no ha sido determinado. En la misma fecha mencionada anteriormente, hay 456 secuencias FASTA asociadas a diferentes cromosomas.<\/p>\n<p>Si desde esta \u00faltima localizaci\u00f3n se accede al <em>Parent Directory<\/em> (<a href=\"https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/\" target=\"_blank\" rel=\"noopener\">https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/<\/a>), encontrar\u00e9is el directorio llamado <em>bigZips<\/em> (https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/bigZips\/), que es otro repositorio de ficheros, con distintos formatos, asociado al genoma humano. Todos los archivos est\u00e1n comprimidos y empaquetados para reducir el tiempo de transmisi\u00f3n.<\/p>\n<p>El fichero hg38.chromFa.tar.gz contiene la secuencia original de los cromosomas separados en archivos independientes. Hay que descargar este fichero y se har\u00e1 con el comando <em>wget, <\/em>pero solo debes descargar el fichero si tienes m\u00e1s de 5 Gb disponibles en el disco duro. Si tienes menos de 5 Gb libres, descarga la secuencia FASTA del cromosoma 7 desde el directorio <a href=\"https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/chromosomes\/\" target=\"_blank\" rel=\"noopener\">https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/chromosomes\/<\/a><\/p>\n<p># El comando <code>df<\/code> es el comando que se utiliza para averiguar el espacio en disco<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"bash\" data-enlighter-theme=\"mowtwo\">$ df -h<\/pre>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"raw\" data-enlighter-theme=\"droide\">Filesystem\u00a0\u00a0\u00a0\u00a0Size\u00a0\u00a0\u00a0\u00a0\u00a0Used \u00a0\u00a0 Available \u00a0\u00a0Use% \u00a0\u00a0 Mounted on\r\n\r\nudev\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0959M\u00a0\u00a0\u00a0\u00a0 0\u00a0\u00a0 \u00a0\u00a0\u00a0\u00a0959M\u00a0\u00a0      0% \u00a0\u00a0\u00a0\u00a0\u00a0\/dev\r\n\r\ntmpfs\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0199M\u00a0    1,4M\u00a0\u00a0  197M\u00a0\u00a0 \u00a0\u00a0\u00a0\u00a0 1% \u00a0\u00a0\u00a0\u00a0\u00a0\/run\r\n\r\n\/dev\/sda5\u00a0\u00a0\u00a0\u00a0\u00a020G\u00a0\u00a0 \u00a0\u00a0\u00a016G\u00a0\u00a0 \u00a0\u00a02,9G\u00a0 \u00a0\u00a0\u00a0\u00a0\u00a0\u00a085% \u00a0\u00a0\u00a0\u00a0\/\r\n\r\ntmpfs\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0991M\u00a0\u00a0\u00a0\u00a0 0\u00a0\u00a0 \u00a0\u00a0\u00a0\u00a0991M\u00a0\u00a0      0% \u00a0\u00a0\u00a0\u00a0\u00a0\/dev\/shm\r\n\r\ntmpfs\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a05,0M\u00a0 \u00a0  4,0K\u00a0\u00a0 \u00a05,0M\u00a0\u00a0 \u00a0\u00a0\u00a0\u00a0\u00a01% \u00a0\u00a0\u00a0\u00a0\u00a0\/run\/lock\r\n\r\ntmpfs\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0991M\u00a0\u00a0\u00a0\u00a0 0\u00a0\u00a0 \u00a0\u00a0\u00a0\u00a0991M\u00a0\u00a0      0% \u00a0\u00a0\u00a0\u00a0\u00a0\/sys\/fs\/cgroup\r\n\r\n\/dev\/loop1\u00a0\u00a0\u00a0\u00a064M\u00a0\u00a0 \u00a0\u00a0 64M\u00a0\u00a0\u00a0\u00a0 0 \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0100% \u00a0\u00a0 \/snap\/core20\/1852<\/pre>\n<p>En la m\u00e1quina en la que se est\u00e1 trabajando solo hay disponibles 2,9 G de espacio (columna <em>Available<\/em>), por lo que en este caso solo se descarga la secuencia FASTA del cromosoma 7. Si hubiera espacio en el disco duro para descargar el fichero con toda la informaci\u00f3n, el procedimiento ser\u00eda el siguiente:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"bash\" data-enlighter-theme=\"mowtwo\">$ wget https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/bigZips\/hg38.chromFa.tar.gz<\/pre>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"raw\" data-enlighter-theme=\"droide\">--2023-04-26 13:22:55--\u00a0\u00a0https:\/\/hgdownload.soe.ucsc.edu\/goldenPath\/hg38\/bigZips\/hg38.chromFa.tar.gz\r\n\r\nS'est\u00e0 resolent hgdownload.soe.ucsc.edu (hgdownload.soe.ucsc.edu)... 128.114.119.163\r\n\r\nS'est\u00e0 connectant a hgdownload.soe.ucsc.edu (hgdownload.soe.ucsc.edu)|128.114.119.163|:443... conectat.\r\n\r\nHTTP: s'ha enviat la petici\u00f3, s'est\u00e0 esperant una resposta... 200 OK\r\n\r\nMida: 983726049 (938M) [application\/x-gzip]\r\n\r\nS'est\u00e0 desant a: \u00abhg38.chromFa.tar.gz\u00bb\r\n\r\nhg38.chromFa.tar.gz\u00a0\u00a0\u00a0 100%[===================================&gt;] 938,15M\u00a0 7,82MB\/s\u00a0\u00a0\u00a0 in 2m 25s\u00a0\r\n\r\n2023-04-26 13:25:22 (6,47 MB\/s) - s'ha desat \u00abhg38.chromFa.tar.gz\u00bb [983726049\/983726049]<\/pre>\n<p>Una vez que el fichero est\u00e1 descargado en la m\u00e1quina Gnu\/Linux con la que se trabaje se debe desempaquetar y descomprimir el fichero con el objetivo de visualizar el contenido de este.<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"bash\" data-enlighter-theme=\"mowtwo\">$\u00a0ls\u00a0-alh\u00a0hg38.chromFa.tar.gz<\/pre>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"raw\" data-enlighter-theme=\"droide\">-rw-rw-r--\u00a01\u00a0student\u00a0student\u00a0939M\u00a0de\u00a0gen.\u00a0\u00a024\u00a0\u00a02014\u00a0hg38.chromFa.tar.gz<\/pre>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"bash\" data-enlighter-theme=\"mowtwo\">$\u00a0tar\u00a0-vzxf\u00a0hg38.chromFa.tar.gz<\/pre>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"raw\" data-enlighter-theme=\"droide\">.\/chroms\/\r\n\r\n.\/chroms\/chr1.fa\r\n\r\n.\/chroms\/chr10.fa\r\n\r\n.\/chroms\/chr11.fa\r\n\r\n.\/chroms\/chr11_KI270721v1_random.fa\r\n\r\n.\/chroms\/chr12.fa\r\n\r\n.\/chroms\/chr13.fa\r\n\r\n\u2026<\/pre>\n<p>Aunque la calidad de la secuencia del genoma humano es aceptable, todav\u00eda se encuentra en fase de mejora. Debido a esto, es com\u00fan encontrar numerosos archivos que contienen fragmentos o variantes que a\u00fan est\u00e1n en discusi\u00f3n y que no necesariamente corresponden a un cromosoma completo. Es posible visualizar el primer cromosoma en el terminal; sin embargo, en algunas partes del cromosoma, como el inicio, la secuencia de nucle\u00f3tidos es desconocida y se denota con el car\u00e1cter <em>N<\/em>. Adem\u00e1s, para indicar la presencia de elementos codificados en la secuencia, se puede utilizar una combinaci\u00f3n de letras may\u00fasculas y min\u00fasculas.<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"bash\" data-enlighter-theme=\"mowtwo\">$ more chr7.fa<\/pre>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"raw\" data-enlighter-theme=\"droide\">NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN\r\n\r\nNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN\r\n\r\n\u2026\r\n\r\n\u2026\r\n\r\nNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN\r\n\r\nNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN\r\n\r\nGAATTCTACATTAGAAAAATAAACCATAGCCTCATCACAGGCACTTAAAT\r\n\r\nACACTGAAGCTGCCAAAACAATCTATCGTTTTGCCTACGTACTTATCAAC\r\n\r\nTTCCTCATAGCAAACTGGGAGAAAAAAGCAATGGAATGAATAAAATGATA\r\n\r\nGCCACAAAAATCAAGGTGGGAGAAATACTTATTATATGTCCATAAAAAAT\r\n\r\nTTTAATTAATGCAAAGTATTAACACCAATGATTGCAGTAATACAGATCTT\r\n\r\nACAAATGATAGTTTTAGTCTGAACAGGACTATCCAAAAGTTAATTTTCTA\r\n\r\nTAGTAACAGTTTTTAAATAAAATATCAATTCCTGAAACACATAAAATGGT\r\n\r\nCCATGAGTATACAACGAGTGAAAAAAAACAAATTCAGAGCAAAGATAAAT\r\n\r\nTAAGAAGTATCTAATATTCAAACATAGTCAAAGAGAGGGAGATTTCTGGA\r\n\r\nTAATCACTTAAGCCCATGGTTAAACATAAATGCAAATATGTTAATGTTTA\r\n\r\nCTGAATAACTTATCTGTGCCAAGTGGTGTATTAATGATTCATTTTTATTT\r\n\r\nTTCACTAAATCTTTTCTCTAAAGTTGGTGTAGCCTGCAACTAAATGCAAG\r\n\r\nAAATCTGACCTAGGACCTGCACTTCTTACCATTTTGCTCATATTTATTCC\r\n\r\nCTGTGCATTTTTGTAACATGTATATGTTATATATATAGAAAGAGAGAGAG\r\n\r\nGCAGAGATGGAAAGTAATTTATGGAGTTTGATGTTATGTCAGGGTAATTA\r\n\r\nCATGATTATATAATTAACAGGTTTCTTTTTAAATCAGCTATATCAATAGA\r\n\r\nAAAATAAATGTAGGAATCAAGAGACTCATTCTGTCCATCTGTGATAGTTC\r\n\r\nCATCATGATACTGCATTGTCAAGTCATTGCTCCAAAAATATGGTTTAGCT\r\n\r\nCAACactgagtgactataggaaaccagaaaccaggctgggcgctaaagat\r\n\r\ngcaaagatgaatgagacatcatctctgccgtccaaaagcttactgtctag\r\n\r\ntgggagagttacacacgtaaggacagtaatctaataagagctaataagtg\r\n\r\naaaactaagataaattaataatacaagattacagggaaggtttccaaagt\r\n\r\ncaatgaggcctcaaatgaatcttgaaagtgtgcaaggattaaccaaatga<\/pre>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La organizaci\u00f3n del genoma de un organismo se da en un conjunto de cromosomas. En este ejemplo, se procede a descargar la anotaci\u00f3n sobre los cromosomas del genoma humano en su distribuci\u00f3n hg38. Se adjunta la tabla 18 con los accesos de descarga que se van a utilizar. Acceso Direcci\u00f3n P\u00e1gina principal servidor UCSC http:\/\/genome.ucsc.edu\/ [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"acf":[],"_links":{"self":[{"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/pages\/348"}],"collection":[{"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/comments?post=348"}],"version-history":[{"count":8,"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/pages\/348\/revisions"}],"predecessor-version":[{"id":1319,"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/pages\/348\/revisions\/1319"}],"wp:attachment":[{"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/media?parent=348"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}