Manipulación de Archivos CSV con Comandos de Terminal
Clase 7 de 26 • Curso de Introducción a la Terminal y Línea de Comandos
Resumen
Aprender a manipular archivos desde la terminal es clave al trabajar con grandes cantidades de información o al realizar análisis de datos sin una interfaz gráfica. Comandos esenciales como cat
, less
, head
, tail
, nl
, wc
y awk
son fundamentales para visualizar y obtener detalles precisos de cualquier archivo de texto plano (especialmente formatos CSV) directamente desde tu terminal, facilitando enormemente su manipulación y análisis.
¿Qué comandos usar para visualizar el contenido de archivos grandes?
Para archivos pequeños o lectura rápida, cat
es útil para mostrar todo el contenido de un archivo. Sin embargo, con archivos grandes como los CSV, utilizar less
es más práctico:
less
te permite ver contenidos de manera pausada e interactiva.- Navegación sencilla dentro del archivo.
- La tecla
Q
sirve para cerrar el archivo cómodamente.
¿Cómo visualizar líneas específicas de un archivo?
Cuando necesitas ver solo partes iniciales o finales de un documento, head
y tail
son ideales:
- Con
head
se visualizan las primeras líneas (por defecto 10). - Con
tail
, en cambio, verás las últimas líneas de tu archivo. - Puedes especificar la cantidad usando la opción
-n
, por ejemplo,head -n 20
otail -n 20
.
¿Cómo contar líneas y palabras en un archivo?
Para formatear y contar las líneas directamente, el comando nl
es práctico:
- Numera automáticamente las líneas del archivo.
- Es especialmente útil para formatear.
Si buscas estadísticas más completas, usa wc
(word count):
- Cuenta palabras, caracteres y líneas.
- Por ejemplo,
wc -w archivo.txt
cuenta palabras. - Para conocer líneas, usa
wc -l archivo.txt
.
¿Qué ofrece el comando awk
para archivos CSV?
awk
es potente para manipular y extraer información específica gracias a su capacidad para realizar búsquedas avanzadas y seleccionar columnas específicas:
- Para seleccionar y visualizar columnas específicas:
awk '{print $1}' archivo.csv
. - Con formato delimitado por comas, usa:
awk -F, '{print $1, $3}' archivo.csv
para mostrar varias columnas.
Estos comandos facilitan enormemente la manipulación de información amplia y variada directamente desde la terminal. Si deseas profundizar en sus funcionalidades, consultar el manual usando man
es muy recomendable, así como experimentar con diferentes opciones y configuraciones para adquirir práctica.