1.11. Buscar, ordenar y asociar ficheros
1.11.3. «cut»
Si el archivo está organizado en campos, como en el caso de la tabla que estamos usando, podemos seleccionar un campo específico utilizando el comando cut
. Para refinar nuestra búsqueda, podemos usar cut
para extraer solo el nombre de transcritos, como en el siguiente ejemplo
$ cut -f 2 hg38_RefSeq.txt | head -7
name NM_001276352.2 NM_001276351.2 NR_075077.2 XM_011541469.1 XM_011541467.1 XM_017001276.1
Con el parámetro -f le indicamos la lista de campos (fields) que queremos seleccionar.
Para indicar los campos que queremos seleccionar:
N
: el campo N (por ejemplo, cut -f 3 file1).N-
: desde el campo N hasta el final (por ejemplo, cut -f 3- file1).N-M
: desde el campo N al M (por ejemplo, cut -f 3-6 file1).-M
: desde el primer campo al campo M (por ejemplo, cut -f -3 file1).N,M
: los campos indicados (por ejemplo, cut -f 3,6,8 file1).
Así podríamos seleccionar los campos del 3 al 5 y del 8 al 10:
$ cut -f 3-5,8-10 hg38_RefSeq.txt
El comando cut
asume que los campos en el fichero están divididos por tabuladores. Pero podríamos indicarle que los campos están divididos de otro modo, por ejemplo, por comas:
$ cut -d ',' fichero_separado_por_comas.txt