1. Introducción a los entornos de trabajo UNIX

1.11. Buscar, ordenar y asociar ficheros

1.11.3. «cut»

Si el archivo está organizado en campos, como en el caso de la tabla que estamos usando, podemos seleccionar un campo específico utilizando el comando cut. Para refinar nuestra búsqueda, podemos usar cut para extraer solo el nombre de transcritos, como en el siguiente ejemplo

$ cut -f 2 hg38_RefSeq.txt | head -7
name

NM_001276352.2

NM_001276351.2

NR_075077.2

XM_011541469.1

XM_011541467.1

XM_017001276.1

Con el parámetro -f le indicamos la lista de campos (fields) que queremos seleccionar.

Para indicar los campos que queremos seleccionar:

  • N : el campo N (por ejemplo, cut -f 3 file1).
  • N- : desde el campo N hasta el final (por ejemplo, cut -f 3- file1).
  • N-M : desde el campo N al M (por ejemplo, cut -f 3-6 file1).
  • -M : desde el primer campo al campo M (por ejemplo, cut -f -3 file1).
  • N,M : los campos indicados (por ejemplo, cut -f 3,6,8 file1).

Así podríamos seleccionar los campos del 3 al 5 y del 8 al 10:

$ cut -f 3-5,8-10 hg38_RefSeq.txt

El comando cut asume que los campos en el fichero están divididos por tabuladores. Pero podríamos indicarle que los campos están divididos de otro modo, por ejemplo, por comas:

$ cut -d ',' fichero_separado_por_comas.txt