Primeros pasos en la arquitectura no transaccional

1

Objetivos y presentaci贸n del proyecto

2

Aprende qu茅 es un Data Warehouse

3

Bases de datos columnares y arquitectura orientada a optimizaci贸n de consultas

4

驴C贸mo funciona AWS Redshift?

Configura tu entorno de trabajo para Redshift

5

Creando nuestro entorno de trabajo en AWS

6

Configura tu primer cluster

7

Consumiendo Redshift: empieza la magia

8

Sentencias SQL en Redshift

C贸mo dise帽ar tu base de datos para mejorar su desempe帽o

9

驴Qu茅 es la compresi贸n en Redshift?

10

Algoritmos de compresi贸n con Redshift

11

Aplicando algoritmos de compresi贸n

12

An谩lisis de desempe帽o con diferentes tipos de compresi贸n

13

Estilos de distribuci贸n con Redshift

14

Evaluando los estilos de distribuci贸n

15

Llaves de ordenamiento para optimizar nuestras consultas

16

Aplicando ordenamiento de columnas

17

Evaluando algoritmos de ordenamiento

18

Buenas pr谩cticas para dise帽ar tablas en Redshift

19

Tipos de datos en AWS Redshift

20

Reto: mejora el desempe帽o de tu base de datos

Manipular enormes cantidades de datos

21

Olv铆date de los insert, el copy llego para quedarse

22

Cargando archivos tipo JSON

23

El comando copy a fondo

24

Manifiestos y uso de COMPUPDATE para carga con compresi贸n autom谩tica

25

M茅todos de carga alternativos al comando copy

26

驴C贸mo ejecutar sentencias UPDATE y DELETE?

27

驴C贸mo mantener el desempe帽o de tu base de datos?

28

Estad铆sticas y limpieza de las tablas

Buenas pr谩cticas para dise帽ar y ejecutar consultas en tu base de datos

29

Agrupamiento, ordenamiento y subqueries

30

驴Qu茅 es y c贸mo interpretar un explain plan?

An谩lisis de comportamiento y descarga de datos con Redshift

31

驴C贸mo descargar datos eficientemente con UNLOAD?

32

Otras tablas 煤tiles de Redshift para entender el comportamiento de nuestros datos

Conclusiones

33

Pr贸ximos pasos con AWS Redshift

No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Llaves de ordenamiento para optimizar nuestras consultas

15/33
Recursos

Aportes 6

Preguntas 0

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

El tipo de ordenamiento compuesto me recuerda mucho al concepto de 铆ndice de una base de datos relacional.

Oracle Index

Clave de clasificaci贸n compuesta

Una clave compuesta se compone de todas las columnas enumeradas en la definici贸n de clave de clasificaci贸n, en el orden en que aparecen. Una clave de clasificaci贸n compuesta es m谩s 煤til cuando el filtro de una consulta aplica condiciones, como filtros y combinaciones, que utilizan un prefijo de las claves de clasificaci贸n. Los beneficios de rendimiento de la clasificaci贸n compuesta disminuyen cuando las consultas dependen solo de columnas de clasificaci贸n secundarias, sin hacer referencia a las columnas primarias. COMPOUND es el tipo de clasificaci贸n predeterminado.

Las claves de ordenaci贸n compuestas pueden acelerar las combinaciones, las operaciones GROUP BY y ORDER BY, y las funciones de ventana que usan PARTITION BY y ORDER BY. Por ejemplo, una combinaci贸n de combinaci贸n, que a menudo es m谩s r谩pida que una combinaci贸n de hash, es factible cuando los datos se distribuyen y clasifican previamente en las columnas de combinaci贸n. Las claves de ordenaci贸n compuestas tambi茅n ayudan a mejorar la compresi贸n.

A medida que agrega filas a una tabla ordenada que ya contiene datos, la regi贸n no ordenada crece, lo que tiene un efecto significativo en el rendimiento. El efecto es mayor cuando la tabla utiliza ordenaci贸n intercalada, especialmente cuando las columnas de ordenaci贸n incluyen datos que aumentan de manera mon贸tona, como columnas de fecha o marca de tiempo. Debe ejecutar una operaci贸n de VAC脥O con regularidad, especialmente despu茅s de grandes cargas de datos, para volver a ordenar y volver a analizar los datos. Para obtener m谩s informaci贸n, consulte Administrar el tama帽o de la regi贸n sin clasificar. Despu茅s de pasar la aspiradora para recurrir a los datos, es una buena pr谩ctica ejecutar un comando ANALYZE para actualizar los metadatos estad铆sticos para el planificador de consultas.

Clave de ordenaci贸n intercalada
Una clave de ordenaci贸n intercalada le otorga el mismo peso a cada columna o subconjunto de columnas en la clave de ordenaci贸n. Si hay distintas consultas que usan diferentes columnas para filtros, puede, por lo general, mejorar el rendimiento de esas consultas utilizando un estilo de ordenaci贸n intercalada. Cuando una consulta usa predicados restrictivos en las columnas de ordenaci贸n secundarias, la ordenaci贸n intercalada mejora considerablemente el rendimiento de la consulta, si se la compara con la ordenaci贸n compuesta

Seg煤n la llave que utilicemos se realizar谩 nuestra consulta y esto significar谩 cantidad de recurso

  • Clave de clasificaci贸n compuesta (COMPOUND)

    Una clave compuesta se compone de todas las columnas enumeradas en la definici贸n de clave de clasificaci贸n, en el orden en que aparecen.聽Una clave de clasificaci贸n compuesta聽es m谩s 煤til cuando el filtro de una consulta aplica condiciones, como filtros y combinaciones, que utilizan un prefijo de las claves de clasificaci贸n. Los beneficios de rendimiento de la clasificaci贸n compuesta disminuyen cuando las consultas dependen solo de columnas de clasificaci贸n secundarias, sin hacer referencia a las columnas primarias. COMPOUND es el tipo de clasificaci贸n predeterminado
    .

    Las claves de ordenaci贸n compuestas pueden acelerar las combinaciones, las operaciones GROUP BY y ORDER BY, y las funciones de ventana que usan PARTITION BY y ORDER BY. Por ejemplo, una combinaci贸n de combinaci贸n, que a menudo es m谩s r谩pida que una combinaci贸n de hash, es factible cuando los datos se distribuyen y clasifican previamente en las columnas de combinaci贸n. Las claves de ordenaci贸n compuestas tambi茅n ayudan a mejorar la compresi贸n
    .

    A medida que agrega filas a una tabla ordenada que ya contiene datos, la regi贸n no ordenada crece, lo que tiene un efecto significativo en el rendimiento. El efecto es mayor cuando la tabla utiliza ordenaci贸n intercalada, especialmente cuando las columnas de ordenaci贸n incluyen datos que aumentan de manera mon贸tona, como columnas de fecha o marca de tiempo. Debe ejecutar una operaci贸n de VAC脥O con regularidad, especialmente despu茅s de grandes cargas de datos, para volver a ordenar y volver a analizar los datos. Para obtener m谩s informaci贸n, consulte聽Administrar el tama帽o de la regi贸n sin clasificar. Despu茅s de pasar la aspiradora para recurrir a los datos, es una buena pr谩ctica ejecutar un comando ANALYZE para actualizar los metadatos estad铆sticos para el planificador de consultas
    .

  • Clave de ordenaci贸n intercalada (INTERLEAVED)

    Una clave de ordenaci贸n intercalada le otorga el mismo peso a cada columna o subconjunto de columnas en la clave de ordenaci贸n. Si hay distintas consultas que usan diferentes columnas para filtros, puede, por lo general, mejorar el rendimiento de esas consultas utilizando un estilo de ordenaci贸n intercalada. Cuando una consulta usa predicados restrictivos en las columnas de ordenaci贸n secundarias, la ordenaci贸n intercalada mejora considerablemente el rendimiento de la consulta, si se la compara con la ordenaci贸n compuesta
    .

  • Art铆culo de AWS: Choose the best sort key

    • To have Amazon Redshift choose the appropriate sort order, specify聽AUTO聽for the sort key.

    • If recent data is queried most frequently, specify the timestamp column as the leading column for the sort key.

      Queries are more efficient because they can skip entire blocks that fall outside the time range.

    • If you do frequent range filtering or equality filtering on one column, specify that column as the sort key.

      Amazon Redshift can skip reading entire blocks of data for that column. It can do so because it tracks the minimum and maximum column values stored on each block and can skip blocks that don鈥檛 apply to the predicate range.

    • If you frequently join a table, specify the join column as both the sort key and the distribution key.

      Doing this enables the query optimizer to choose a sort merge join instead of a slower hash join. Because the data is already sorted on the join key, the query optimizer can bypass the sort phase of the sort merge join.

      Choose the best sort key

Desventaja de user llaves de ordenamiento: La carga de datos es mas lenta