Primeros pasos en la arquitectura no transaccional

1

Objetivos y presentaci贸n del proyecto

2

Aprende qu茅 es un Data Warehouse

3

Bases de datos columnares y arquitectura orientada a optimizaci贸n de consultas

4

驴C贸mo funciona AWS Redshift?

Configura tu entorno de trabajo para Redshift

5

Creando nuestro entorno de trabajo en AWS

6

Configura tu primer cluster

7

Consumiendo Redshift: empieza la magia

8

Sentencias SQL en Redshift

C贸mo dise帽ar tu base de datos para mejorar su desempe帽o

9

驴Qu茅 es la compresi贸n en Redshift?

10

Algoritmos de compresi贸n con Redshift

11

Aplicando algoritmos de compresi贸n

12

An谩lisis de desempe帽o con diferentes tipos de compresi贸n

13

Estilos de distribuci贸n con Redshift

14

Evaluando los estilos de distribuci贸n

15

Llaves de ordenamiento para optimizar nuestras consultas

16

Aplicando ordenamiento de columnas

17

Evaluando algoritmos de ordenamiento

18

Buenas pr谩cticas para dise帽ar tablas en Redshift

19

Tipos de datos en AWS Redshift

20

Reto: mejora el desempe帽o de tu base de datos

Manipular enormes cantidades de datos

21

Olv铆date de los insert, el copy llego para quedarse

22

Cargando archivos tipo JSON

23

El comando copy a fondo

24

Manifiestos y uso de COMPUPDATE para carga con compresi贸n autom谩tica

25

M茅todos de carga alternativos al comando copy

26

驴C贸mo ejecutar sentencias UPDATE y DELETE?

27

驴C贸mo mantener el desempe帽o de tu base de datos?

28

Estad铆sticas y limpieza de las tablas

Buenas pr谩cticas para dise帽ar y ejecutar consultas en tu base de datos

29

Agrupamiento, ordenamiento y subqueries

30

驴Qu茅 es y c贸mo interpretar un explain plan?

An谩lisis de comportamiento y descarga de datos con Redshift

31

驴C贸mo descargar datos eficientemente con UNLOAD?

32

Otras tablas 煤tiles de Redshift para entender el comportamiento de nuestros datos

Conclusiones

33

Pr贸ximos pasos con AWS Redshift

No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Adquiere por un a帽o todos los cursos, escuelas y certificados por un precio especial.

Antes: $249

Currency
$219/a帽o

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Comprar ahora

Termina en:

0D
22H
55M
34S

Estilos de distribuci贸n con Redshift

13/33
Recursos

Aportes 6

Preguntas 0

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

Estilos de distribuci贸n

Cuando crea una tabla, puede designar uno de los cuatro estilos de distribuci贸n: AUTO, EVEN, KEY o ALL.

Si no se especifica un estilo de distribuci贸n, Amazon Redshift usa la distribuci贸n AUTO.

Distribuci贸n AUTO

Con la distribuci贸n AUTO, Amazon Redshift asigna un estilo de distribuci贸n 贸ptimo basado en el tama帽o de los datos de la tabla. Por ejemplo, Amazon Redshift asigna inicialmente la distribuci贸n ALL a una tabla peque帽a, a continuaci贸n, cambia a una distribuci贸n EVEN cuando la tabla crece m谩s. Cuando una tabla cambia de una distribuci贸n ALL a EVEN, la utilizaci贸n del almacenamiento podr铆a cambiar ligeramente. El cambio en la distribuci贸n se produce en segundo plano y tarda pocos segundos.

Cuando se establece DISTSTYLE en AUTO, Amazon Redshift podr铆a cambiar la distribuci贸n de los datos de la tabla para que tengan un estilo de distribuci贸n basado en KEY.

Para ver el estilo de distribuci贸n aplicado a una tabla, consulte la vista de cat谩logo del sistema PG_CLASS_INFO. Para obtener m谩s informaci贸n, consulte Visualizaci贸n de los estilos de distribuci贸n. Si no se especifica un estilo de distribuci贸n con la instrucci贸n CREATE TABLE, Amazon Redshift aplica la distribuci贸n AUTO.

Distribuci贸n EVEN

El nodo principal distribuye las filas entre los sectores con un m茅todo de turnos rotativos, independientemente de los valores de cualquier columna en particular. La distribuci贸n EVEN es adecuada cuando una tabla no participa de combinaciones o cuando no hay una selecci贸n clara entre la distribuci贸n KEY y la distribuci贸n ALL.

Distribuci贸n KEY

Las filas se distribuyen seg煤n los valores de una columna. El nodo principal ubica juntos los valores que coinciden en el mismo sector del nodo. Si distribuye un par de tablas en las claves de combinaci贸n, el nodo principal ubica juntas las filas en los sectores seg煤n los valores de las columnas de combinaci贸n para que los valores que coinciden en las columnas que tienen en com煤n se almacenen juntos f铆sicamente.

Distribuci贸n ALL

Se distribuye una copia de toda la tabla a cada nodo. Mientras que la distribuci贸n EVEN o la distribuci贸n KEY colocan solo una parte de las filas de la tabla en cada nodo, la distribuci贸n ALL garantiza que se coloque cada fila para cada combinaci贸n en la que participa la tabla.

La distribuci贸n ALL multiplica el almacenamiento requerido por la cantidad de nodos del cl煤ster, por lo que demanda m谩s tiempo para cargar, actualizar o insertar datos en distintas tablas. La distribuci贸n ALL es adecuada solo para tablas con movimientos relativamente lentos, es decir tablas que no se actualizan con frecuencia ni de forma generalizada. Dado que el costo de redistribuir tablas peque帽as durante una consulta es bajo, no hay un beneficio significativo para definir tablas de dimensiones peque帽as como DISTSTYLE ALL.

Distribucion con Redshift

Distribuir carga significa compartir esa carga de trabajo de una tabla de manera equitativa en los nodos, si no est谩 distribuida correctamente, unos nodos trabajar谩n m谩s que otros, y eso se traduce en consultas m谩s lentas.

Distribuci贸n key: Determinada columna a mismas locaciones
鈥 Mejora los joins y group by
鈥 Los valores llave se almacenan juntos f铆sicamente en cada nodo.

Distribucion ALL: Todos los datos se replican en cada nodo
鈥 Se usa en tablas peque帽as
鈥 Se distribuyen todos los datos de la tabla en cada nodo.
鈥 Ocupa m谩s espacio en disco y requiere m谩s tiempo para actualizar, eliminar e insertar

Distrbucion Even: Distribuci贸n Roun鈥檙obin
鈥 脷sala si no es posibl una partici贸n tipo key
鈥 La data se distribuye en todos los nodos y slides de manera rotativa

En que casos una tabla puede no tener key, por lo que cual se pueda utilizar la distribuci贸n even.

Creer铆a que al dise帽a el modelo OLTP, todas las tablas deber铆an de tener una llave