Manipulación de Archivos CSV con Comandos de Terminal

Clase 7 de 26Curso de Introducción a la Terminal y Línea de Comandos

Resumen

Aprender a manipular archivos desde la terminal es clave al trabajar con grandes cantidades de información o al realizar análisis de datos sin una interfaz gráfica. Comandos esenciales como cat, less, head, tail, nl, wc y awk son fundamentales para visualizar y obtener detalles precisos de cualquier archivo de texto plano (especialmente formatos CSV) directamente desde tu terminal, facilitando enormemente su manipulación y análisis.

¿Qué comandos usar para visualizar el contenido de archivos grandes?

Para archivos pequeños o lectura rápida, cat es útil para mostrar todo el contenido de un archivo. Sin embargo, con archivos grandes como los CSV, utilizar less es más práctico:

  • less te permite ver contenidos de manera pausada e interactiva.
  • Navegación sencilla dentro del archivo.
  • La tecla Q sirve para cerrar el archivo cómodamente.

¿Cómo visualizar líneas específicas de un archivo?

Cuando necesitas ver solo partes iniciales o finales de un documento, head y tail son ideales:

  • Con head se visualizan las primeras líneas (por defecto 10).
  • Con tail, en cambio, verás las últimas líneas de tu archivo.
  • Puedes especificar la cantidad usando la opción -n, por ejemplo, head -n 20 o tail -n 20.

¿Cómo contar líneas y palabras en un archivo?

Para formatear y contar las líneas directamente, el comando nl es práctico:

  • Numera automáticamente las líneas del archivo.
  • Es especialmente útil para formatear.

Si buscas estadísticas más completas, usa wc (word count):

  • Cuenta palabras, caracteres y líneas.
  • Por ejemplo, wc -w archivo.txt cuenta palabras.
  • Para conocer líneas, usa wc -l archivo.txt.

¿Qué ofrece el comando awk para archivos CSV?

awk es potente para manipular y extraer información específica gracias a su capacidad para realizar búsquedas avanzadas y seleccionar columnas específicas:

  • Para seleccionar y visualizar columnas específicas: awk '{print $1}' archivo.csv.
  • Con formato delimitado por comas, usa: awk -F, '{print $1, $3}' archivo.csv para mostrar varias columnas.

Estos comandos facilitan enormemente la manipulación de información amplia y variada directamente desde la terminal. Si deseas profundizar en sus funcionalidades, consultar el manual usando man es muy recomendable, así como experimentar con diferentes opciones y configuraciones para adquirir práctica.