que es un data warehouse?

Pregunta de la clase:
ETL
Miguel Juan Carlos Rojas Ortega

Miguel Juan Carlos Rojas Ortega

Pregunta
studenthace 5 años

que es un data warehouse?

3 respuestas
para escribir tu comentario
    Dayron Alberto Cuadros Julio

    Dayron Alberto Cuadros Julio

    studenthace 5 años

    Hola Juan Carlos

    Para complementar, los datawarehouse se diferencian de las bases de datos principalmente porque están diseñados para facilitar el análisis de datos (no tanto para almacenarla) y para lograr ese objetivo, permiten ver cómo los datos cambian en el tiempo, permiten centralizar en ellos data de diversos origenes para encontrar correlaciones y poder responder las preguntas clave de un negocio.

    Sandra Liliana Delgado Gómez

    Sandra Liliana Delgado Gómez

    studenthace 5 años

    El **Data Warehouse **es un almacén de datos que se utiliza como repositorio de los datos luego que hacemos procesos de ETL y esta la data lista para realizar los procesos analíticos de Business Intelligence o Data Science, machine learning... te coloco una imagen que visualmente te puede hacer comprender el concepto de inmediato

    data warehouse.png

    como ves en la imagen la primera parte cuenta con las diversas fuentes de datos que podríamos tener, lo que hace que la data este en diferentes estructuras.

    Al obtener la data el siguiente proceso es hacer ETL (extract, transform and load) que es la base principal de este curso de ingeniería de datos, una vez que dejamos la data lista y optima para los procesos analíticos esa info se almacena en un sitio, para nuestro caso como estudiantes puede ser en nuestro propio pc en una carpeta, ese sería nuestro data warehouse, sin embargo, cuando nos vamos a una empresa el data warehouse usualmente lo manejan en servidores de nube por practicidad y acceso para todas las dependencias y por procesos de analítica.

    Las áreas de analítica toman como input para su trabajo solo la información del data warehouse ya que es la que cuenta con las condiciones optimas para realizar modelos analíticos, machine learning, analítica con sus dashboards en BI

    Roger Carlos Ariel Alba

    Roger Carlos Ariel Alba

    studenthace 5 años

    Hola Juan Carlos,

    Bien puede ser una habitación, un centro de almacenamiento o un repositorio de base de datos. Puede ser físico o lógico.

    Saludos

Curso de Ingeniería de Datos con Python

Curso de Ingeniería de Datos con Python

Genera un set de datos capaz de generar predicciones a partir de algoritmos de machine learning. Encuentra fuentes ideales de datos. Trata, limpia y alista información para crear tu dataset y da el primer paso para formarte en la Carrera de Ciencia de Datos.

Curso de Ingeniería de Datos con Python
Curso de Ingeniería de Datos con Python

Curso de Ingeniería de Datos con Python

Genera un set de datos capaz de generar predicciones a partir de algoritmos de machine learning. Encuentra fuentes ideales de datos. Trata, limpia y alista información para crear tu dataset y da el primer paso para formarte en la Carrera de Ciencia de Datos.