{"id":369,"date":"2023-09-01T11:36:56","date_gmt":"2023-09-01T09:36:56","guid":{"rendered":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/?page_id=369"},"modified":"2025-03-07T18:17:33","modified_gmt":"2025-03-07T16:17:33","slug":"actividades","status":"publish","type":"page","link":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/actividades\/","title":{"rendered":"Actividades"},"content":{"rendered":"<ol>\n<li>Realizad la instalaci\u00f3n de la versi\u00f3n m\u00e1s reciente de Ubuntu MATE dentro de una m\u00e1quina virtual de Oracle VirtualBox. Para ello, primero deb\u00e9is obtener una imagen ISO de Ubuntu MATE. Posteriormente, es necesario crear una m\u00e1quina virtual vac\u00eda, insertar la imagen ISO de Ubuntu y ejecutar la instalaci\u00f3n. Pod\u00e9is emplear un administrador de la gesti\u00f3n de paquetes de software para configurar el sistema final resultante.<\/li>\n<li>Averiguad las funciones que realiza el comando <code>fold<\/code> del terminal. Analizar las opciones disponibles para este comando. Despu\u00e9s, dise\u00f1ad un peque\u00f1o <em>script <\/em>que combine <em>gawk<\/em> con el comando <code>fold<\/code> para calcular la frecuencia de aparici\u00f3n absoluta y relativa de cada clase de nucle\u00f3tido en una secuencia gen\u00f3mica almacenada en un fichero de texto guardado en formato FASTA. Evaluad el funcionamiento de vuestro protocolo sobre varias secuencias de ADN.<\/li>\n<li>Averiguad las funciones realizadas por <em>Bioawk<\/em>. Determinad cu\u00e1l es el comando origen de esta extensi\u00f3n, los formatos de datos biol\u00f3gicos que soporta y si es posible trabajar con ficheros comprimidos con <em>gzip<\/em> o con otros comandos compresores.<\/li>\n<li>Estudiad el comando <code>sedl<\/code>. Para probar su eficacia, grabad una hoja de estilo de <em>MicrosoftExcel <\/em>en formato texto (seleccionar el tabulador como separador de campos). Una vez en Gnu\/Linux, verificad con el comando <code>od<\/code> que este formato propietario efectivamente introduce como salto de l\u00ednea los caracteres <code>\\r<\/code> y <code>\\n<\/code>. Finalmente, emplead el comando <em>sed<\/em> para \u00fanicamente mantener el car\u00e1cter <code>\\n<\/code> (el terminal trabaja en este formato).<\/li>\n<li>Dise\u00f1ad un <em>script <\/em>en el terminal que os permita realizar el an\u00e1lisis completo de una serie de ficheros de la clase <code>refGene_human.txt<\/code> almacenados en un directorio. Cada fichero debe contener en su propio nombre el organismo al que pertenece para evitar nombres de ficheros duplicados (p.e. txt). Para cada genoma podemos realizar las mismas preguntas mostradas en el caso de estudio de los materiales te\u00f3ricos.<\/li>\n<li>A continuaci\u00f3n, suministramos un archivo FASTA y deb\u00e9is contestar a las siguientes preguntas. El separador entre las dos columnas es el <code>\\t<\/code><\/li>\n<\/ol>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"bash\" data-enlighter-theme=\"mowtwo\">$ cat hib.fasta<\/pre>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"raw\" data-enlighter-theme=\"droide\">HiB_C1\u00a0\u00a0\u00a0 TGTTTGTTGTCACTGACTGATGTTGTGGTCTGG\r\n\r\nHiB_C2\u00a0\u00a0\u00a0 TATATATTACTT\r\n\r\nHiB_C3\u00a0\u00a0\u00a0 TATATATAACTTATA\r\n\r\nHiB_C4\u00a0\u00a0\u00a0 TATATATAACTTATA\r\n\r\nHiB_C5\u00a0\u00a0\u00a0 TATATATTACTT<\/pre>\n<ul>\n<li>Imprimid la l\u00ednea que coincide con el patr\u00f3n <code>HiB_C4<\/code>.<\/li>\n<li>Imprimid la columna 1, un punto y coma, y la columna 2.<\/li>\n<li>Usad el concepto de un operador condicional en la declaraci\u00f3n de impresi\u00f3n de la forma <em>print <\/em><strong>CONDITION ? PRINT_IF_TRUE_TEXT : PRINT_IF_FALSE_TEXT<\/strong> para identificar las secuencias con longitudes &gt; 14.<\/li>\n<li>Intentad realizar el siguiente ejercicio. \u00bfQu\u00e9 es lo que ocurre?<\/li>\n<\/ul>\n<p>Se puede usar e1 despu\u00e9s del \u00faltimo bloque {} para imprimir todo (1 es una notaci\u00f3n abreviada para {print $0} que se convierte en {print}, ya que, sin ning\u00fan argumento, <em>print<\/em> imprimir\u00e1 $0 por defecto), y dentro de este bloque, podemos cambiar $0, por ejemplo, para asignar el primer campo a $0 para la segunda l\u00ednea (NR==2).<\/p>\n<ul>\n<li>Usad el comando <code>getline<\/code> para cargar el contenido de otro archivo adem\u00e1s del que est\u00e1s leyendo. Intenta, con el bucle <em>while<\/em>, cargar cada l\u00ednea del fichero <em>fasta<\/em> en una variable: la <em>b<\/em>, por ejemplo.<\/li>\n<\/ul>\n<ol start=\"7\">\n<li>Contestad a las siguientes preguntas despu\u00e9s de descargar el siguiente fichero: <a href=\"https:\/\/ftp.ncbi.nlm.nih.gov\/genomes\/ASSEMBLY_REPORTS\/assembly_summary_refseq.txt\" target=\"_blank\" rel=\"noopener\">https:\/\/ftp.ncbi.nlm.nih.gov\/genomes\/ASSEMBLY_REPORTS\/assembly_summary_refseq.txt<\/a><\/li>\n<\/ol>\n<ul>\n<li>Los valores \u00fanicos de la variable categ\u00f3rica <em>assembly<\/em>_<em>level<\/em> se encuentran indicados en la columna #12, la cual muestra el estado del <em>ensamble<\/em>. \u00bfCu\u00e1les son?<\/li>\n<li>Determinad el n\u00famero de genomas por especie, que se encuentra en la columna #8. Luego, deb\u00e9is mostrar \u00fanicamente las 10 especies con la mayor cantidad de genomas secuenciados.<\/li>\n<li>\u00bfCu\u00e1ntos genomas completos hay del g\u00e9nero <em>Mycobacterium<\/em>?<\/li>\n<li>Contad los genomas de <em>Salmonella<\/em>, <em>Pseudomonas<\/em> y <em>Acinetobacter<\/em> (por g\u00e9nero) y presentad la lista ordenada por n\u00famero decreciente de genomas.<\/li>\n<li>Determinad la longitud de una cadena: \u00bfPor qu\u00e9 estos dos comandos dan diferente informaci\u00f3n?<\/li>\n<\/ul>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"bash\" data-enlighter-theme=\"mowtwo\">$ echo 'atattttGAATTtattGAATCAGGACC' | wc -c<\/pre>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"bash\" data-enlighter-theme=\"mowtwo\">$ echo 'atattttGAATTtattGAATCAGGACC' | awk 'END{print \"El oligonucle\u00f3tido\", $0, \"tiene\" lenght($0), \"nucle\u00f3tidos de longitud\"}'<\/pre>\n<ol start=\"8\">\n<li>Eligid varios ficheros que contengan secuencias FASTA.<\/li>\n<\/ol>\n<ul>\n<li>El n\u00famero de secuencias para un fichero (<em>awk<\/em>, autoincremento).<\/li>\n<li>Con un bucle determina el n\u00famero de secuencias para todos los ficheros (<em>for and<\/em>, <em>awk<\/em>, autoincremento).<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Realizad la instalaci\u00f3n de la versi\u00f3n m\u00e1s reciente de Ubuntu MATE dentro de una m\u00e1quina virtual de Oracle VirtualBox. Para ello, primero deb\u00e9is obtener una imagen ISO de Ubuntu MATE. Posteriormente, es necesario crear una m\u00e1quina virtual vac\u00eda, insertar la imagen ISO de Ubuntu y ejecutar la instalaci\u00f3n. Pod\u00e9is emplear un administrador de la gesti\u00f3n [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"acf":[],"_links":{"self":[{"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/pages\/369"}],"collection":[{"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/comments?post=369"}],"version-history":[{"count":11,"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/pages\/369\/revisions"}],"predecessor-version":[{"id":1324,"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/pages\/369\/revisions\/1324"}],"wp:attachment":[{"href":"http:\/\/eines-informatiques.recursos.uoc.edu\/introduccion-a-los-entornos-de-trabajo-gnu-linux\/es\/wp-json\/wp\/v2\/media?parent=369"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}