Comandos Esenciales para Databricks File System (DBFS)

Clase 22 de 25Curso de Databricks: Arquitectura Delta Lake

Comandos esenciales de DBFS

Databricks File System (DBFS) es un sistema de archivos distribuido integrado en la plataforma de Apache Spark y Databricks. Proporciona acceso a datos y archivos almacenados en un entorno de Databricks.

A continuación, se presentan algunos comandos esenciales de DBFS que puedes utilizar en un notebook de Databricks o a través de Databricks CLI, en el caso de utilizar la versión de pago de Databricks:

Captura de pantalla 2024-03-06 a la(s) 3.18.21 p. m..png

Estos comandos son ejecutados en celdas de código en un notebook de Databricks y utilizan el prefijo %fs para indicar que se están ejecutando comandos de sistema de archivos.

También, es posible utilizar los comandos basados en “dbutils”:

Importante: Cuando se ejecuta el comando %fs, no se puede colocar ningún código adicional en la celda, únicamente el comando de DBFS.