Comando Copy
-
Procesamiento masivo en paralelo (MPP)
-
Un solo llamado para múltiples archivos.
-
Compresión de archivos (Cargar archivos comprimidos)
-
Compatible con s3.
Carga de archivos
-
Otorgar permisos al recurso (A través del rol)
-
Validar formato de archivos (Debe de estar en UTF-8).
-
Verificar longitudes de las columnas.
-
¿Existe un delimitador?
-
Comprobar el formato de fechas.
-
Particionar los datos en distintos archivos.
¿En cuantos archivos debo dividir mis datos?
Cargar archivos múltiplos del numero de slide por nodo.
2 slides, 2 nodos -> 4 archivos.
Recomendación de tamaño: 110 MB por archivo después de la compresión.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.