Primeros pasos en la arquitectura no transaccional

1

Objetivos y presentación del proyecto

2

Aprende qué es un Data Warehouse

3

Bases de datos columnares y arquitectura orientada a optimización de consultas

4

¿Cómo funciona AWS Redshift?

Configura tu entorno de trabajo para Redshift

5

Creando nuestro entorno de trabajo en AWS

6

Configura tu primer cluster

7

Consumiendo Redshift: empieza la magia

8

Sentencias SQL en Redshift

Cómo diseñar tu base de datos para mejorar su desempeño

9

¿Qué es la compresión en Redshift?

10

Algoritmos de compresión con Redshift

11

Aplicando algoritmos de compresión

12

Análisis de desempeño con diferentes tipos de compresión

13

Estilos de distribución con Redshift

14

Evaluando los estilos de distribución

15

Llaves de ordenamiento para optimizar nuestras consultas

16

Aplicando ordenamiento de columnas

17

Evaluando algoritmos de ordenamiento

18

Buenas prácticas para diseñar tablas en Redshift

19

Tipos de datos en AWS Redshift

20

Reto: mejora el desempeño de tu base de datos

Manipular enormes cantidades de datos

21

Olvídate de los insert, el copy llego para quedarse

22

Cargando archivos tipo JSON

23

El comando copy a fondo

24

Manifiestos y uso de COMPUPDATE para carga con compresión automática

25

Métodos de carga alternativos al comando copy

26

¿Cómo ejecutar sentencias UPDATE y DELETE?

27

¿Cómo mantener el desempeño de tu base de datos?

28

Estadísticas y limpieza de las tablas

Buenas prácticas para diseñar y ejecutar consultas en tu base de datos

29

Agrupamiento, ordenamiento y subqueries

30

¿Qué es y cómo interpretar un explain plan?

Análisis de comportamiento y descarga de datos con Redshift

31

¿Cómo descargar datos eficientemente con UNLOAD?

32

Otras tablas útiles de Redshift para entender el comportamiento de nuestros datos

Conclusiones

33

Próximos pasos con AWS Redshift

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Estilos de distribución con Redshift

13/33
Recursos

Aportes 6

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Estilos de distribución

Cuando crea una tabla, puede designar uno de los cuatro estilos de distribución: AUTO, EVEN, KEY o ALL.

Si no se especifica un estilo de distribución, Amazon Redshift usa la distribución AUTO.

Distribución AUTO

Con la distribución AUTO, Amazon Redshift asigna un estilo de distribución óptimo basado en el tamaño de los datos de la tabla. Por ejemplo, Amazon Redshift asigna inicialmente la distribución ALL a una tabla pequeña, a continuación, cambia a una distribución EVEN cuando la tabla crece más. Cuando una tabla cambia de una distribución ALL a EVEN, la utilización del almacenamiento podría cambiar ligeramente. El cambio en la distribución se produce en segundo plano y tarda pocos segundos.

Cuando se establece DISTSTYLE en AUTO, Amazon Redshift podría cambiar la distribución de los datos de la tabla para que tengan un estilo de distribución basado en KEY.

Para ver el estilo de distribución aplicado a una tabla, consulte la vista de catálogo del sistema PG_CLASS_INFO. Para obtener más información, consulte Visualización de los estilos de distribución. Si no se especifica un estilo de distribución con la instrucción CREATE TABLE, Amazon Redshift aplica la distribución AUTO.

Distribución EVEN

El nodo principal distribuye las filas entre los sectores con un método de turnos rotativos, independientemente de los valores de cualquier columna en particular. La distribución EVEN es adecuada cuando una tabla no participa de combinaciones o cuando no hay una selección clara entre la distribución KEY y la distribución ALL.

Distribución KEY

Las filas se distribuyen según los valores de una columna. El nodo principal ubica juntos los valores que coinciden en el mismo sector del nodo. Si distribuye un par de tablas en las claves de combinación, el nodo principal ubica juntas las filas en los sectores según los valores de las columnas de combinación para que los valores que coinciden en las columnas que tienen en común se almacenen juntos físicamente.

Distribución ALL

Se distribuye una copia de toda la tabla a cada nodo. Mientras que la distribución EVEN o la distribución KEY colocan solo una parte de las filas de la tabla en cada nodo, la distribución ALL garantiza que se coloque cada fila para cada combinación en la que participa la tabla.

La distribución ALL multiplica el almacenamiento requerido por la cantidad de nodos del clúster, por lo que demanda más tiempo para cargar, actualizar o insertar datos en distintas tablas. La distribución ALL es adecuada solo para tablas con movimientos relativamente lentos, es decir tablas que no se actualizan con frecuencia ni de forma generalizada. Dado que el costo de redistribuir tablas pequeñas durante una consulta es bajo, no hay un beneficio significativo para definir tablas de dimensiones pequeñas como DISTSTYLE ALL.

Distribucion con Redshift

Distribuir carga significa compartir esa carga de trabajo de una tabla de manera equitativa en los nodos, si no está distribuida correctamente, unos nodos trabajarán más que otros, y eso se traduce en consultas más lentas.

Distribución key: Determinada columna a mismas locaciones
• Mejora los joins y group by
• Los valores llave se almacenan juntos físicamente en cada nodo.

Distribucion ALL: Todos los datos se replican en cada nodo
• Se usa en tablas pequeñas
• Se distribuyen todos los datos de la tabla en cada nodo.
• Ocupa más espacio en disco y requiere más tiempo para actualizar, eliminar e insertar

Distrbucion Even: Distribución Roun’robin
• Úsala si no es posibl una partición tipo key
• La data se distribuye en todos los nodos y slides de manera rotativa

En que casos una tabla puede no tener key, por lo que cual se pueda utilizar la distribución even.

Creería que al diseña el modelo OLTP, todas las tablas deberían de tener una llave