Bienvenida conceptos básicos y contexto histórico de las Bases de Datos

1

Bienvenida conceptos básicos y contexto histórico de las Bases de Datos

Introducción a las bases de datos relacionales

2

Historia de las bases de datos relacionales

3

Entidades y atributos

4

Entidades de Platzi Blog

5

Relaciones

6

Múltiples muchos

7

Diagrama ER

8

Diagrama Físico: tipos de datos y constraints

9

Diagrama Físico: normalización

10

Formas normales en Bases de Datos relacionales

11

Diagrama Físico: normalizando Platziblog

RDBMS (MySQL) o cómo hacer lo anterior de manera práctica

12

¿Qué es RDB y RDBMS?

13

Instalación local de un RDBMS (Windows)

14

Instalación local de un RDBMS (Mac)

15

Instalación local de un RDBMS (Ubuntu)

16

Clientes gráficos

17

Servicios administrados

SQL hasta en la sopa

18

Historia de SQL

19

DDL create

20

CREATE VIEW y DDL ALTER

21

DDL drop

22

DML

23

¿Qué tan standard es SQL?

24

Creando Platziblog: tablas independientes

25

Creando Platziblog: tablas dependientes

26

Creando Platziblog: tablas transitivas

Consultas a una base de datos

27

¿Por qué las consultas son tan importantes?

28

Estructura básica de un Query

29

SELECT

30

FROM

31

Utilizando la sentencia FROM

32

WHERE

33

Utilizando la sentencia WHERE nulo y no nulo

34

GROUP BY

35

ORDER BY y HAVING

36

El interminable agujero de conejo (Nested queries)

37

¿Cómo convertir una pregunta en un query SQL?

38

Preguntándole a la base de datos

39

Consultando PlatziBlog

Introducción a la bases de datos NO relacionales

40

¿Qué son y cuáles son los tipos de bases de datos no relacionales?

41

Servicios administrados y jerarquía de datos

Manejo de modelos de datos en bases de datos no relacionales

42

Top level collection con Firebase

43

Creando y borrando documentos en Firestore

44

Colecciones vs subcolecciones

45

Recreando Platziblog

46

Construyendo Platziblog en Firestore

47

Proyecto final: transformando tu proyecto en una db no relacional

Bases de datos en la vida real

48

Bases de datos en la vida real

49

Big Data

50

Data warehouse

51

Data mining

52

ETL

53

Business intelligence

54

Machine Learning

55

Data Science

56

¿Por qué aprender bases de datos hoy?

Bonus

57

Bases de datos relacionales vs no relacionales

58

Elegir una base de datos

Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Data Science

55/58
Recursos

Data Science es aplicar todas las técnicas de procesamiento de datos. En su manera más pura tiene que ver con gente con un background de estadísticas y ciencias duras.

Aportes 119

Preguntas 3

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Saludos! Estas son mis notas tomadas durante este bloque de clases por si a alguien les son utiles.

Hoy en dia no existen bases de datos ‘one size fits all’, es decir, hoy en dia en las aplicaciones modernas se utilizan distintas bases de datos ya sean relacionales, no relacionales, etc en una sola aplicacion. Las bases de datos relacionales servian muy bien por un tiempo para cumplir con varias demandas pero a medida que llego el Big Data estas no pudieron manejar bien toda esta carga con lo cual fueron creando otras.

  • Big Data: Grandes cantidades de datos, el reto que empezo a cerrar las puertas fueron que se estuvieron manejando cada vez mas grandes, grandes volumenes de datos. Se refiere a que en este momento en milesimas de segundos vamos a guardar grandes cantidades de datos. Es un gran movimiento que surgio con Youtube y Facebook ya que necesitaban guardar muchoos datos rapido.
  • Data Warehouse: Guardar grandes cantidades masivas de datos, la diferencia con Big Data es guardar mas datos que en Big Data pero que son datos historicos, es decir, que no se extraen muy a menudo. Ejemplo de Google que usa eso es Bigtable, otra solucion es BigQuery.
  • Data Mining: Es literal picar piedra, es decir, debido a que el orden en que se guardaban estos datos no era el mas optimo o el mas eficaz nos toca como data miners intentar buscar en todos esos datos y sacar informacion util que ayude en las decisiones de negocio. En si no se refiere a una base de datos sino a un conjunto de tecnicas para extraer informacion valiosa para las empresas.
  • ETL: Son las siglas de Extract, Transform, Load. Se trata de tomar datos de archivos muertos y convertirlos en algo que sea de utilidad para el negocio. Tambien ayuda a tomar los datos viveos de la aplicacion, transformarlos y guardarlos en un data warehouse periodicamente. Esta tecnica tiene dos grandes usos: Para el datamining cuando tenemos una base de datos sin orden, sacamos la info, la limpiamos y la guardamos en un data warehouse y ahora si esta ordenada y podemos sacarle provecho a ella. Otro gran caso de uso es mas o menos similar pero cuando lo tenemos que hacer en tiempo real que sirve para hacer etl, es decir, guardamos el estado en bases de datos no relacional que no son muy buenas manejando queries complejos y si tenemos muchas relaciones y con ETL podemos aprovechar la informacion aunque este asi y obtener informacion valiosa. Aunque no existen tecnologias que hagan todo el proceso existen los data pipelines para manejar todas estas fases.
  • Business Intelligence: Como el nombre lo dice inteligencia para el negocio, que se refiere a tener los datos de manera oportuna y datos correctos que los ayuden a dar informacion necesaria para hacer las decisiones correctas. Con esto tratamos de hacer sentido a toda la info obtenida y nos ayuda a saber digamos que tipo de audiencia tenemos, el historico de como han ido las ventas en ciertos periodos, es decir, nos permite visualizar las relaciones que tiene nuestro sistema y aplicacion y los clientes entre si. Herramientas para esto: Tableau, QlikView, PowerBI.
  • Machine Learning: Son una serie de tecnicas que involucran la inteligencia artificial y deteccion de patrones. A diferencia de Business Intelligence que queremos buscar un patron en especifico con la informacion que ya tenemos, mientras que con Machine Learning dado un conjunto de datos buscamos encontrar patrones que no esperas o no eran obvios para un ser humano, ademas que busca saber en un futuro como se comportarian nuestros usuarios. Una bd muy buena para esto es BigQuery que nos sirve como warehouse y ademas nos permite hacer queries que nos podrian ayudar con BusinessIntelligence como son Data Studio. Entre los dos casos de uso principales de ML son: clasificacion y prediccion.
    • Con la clasificacion nos referimos a que si tenemos varios datos historicos y queremos conocer por ejemplo cuales temas fueron mas interesantes durante un periodo en especifico, no serviria con buscar palabras claves, para este tipo de casos se utiliza la tecnica de ML denominada Procesamiento de Lenguaje Natural lo que hace es tomar un texto o reconocimiento de voz que utiliza el lenguaje natural humano nada estructurado, lo empieza a procesar y nos devuelve los patrones que encontro. Por ejemplo con el Platziblog: Si tenemos un modelo muy bien entrenado, es decir, que le hayamos pasado una buena cantidad de articulos que si sabemos que son de politica y reconoce estos patrones. Cuando le pasamos toda la informacion de Platziblog nos devuelve articulos que no especificaban por ninguna parte que se trataban de politica pero gracias al modelo pudimos identificarlos.
    • Con la prediccion nos ayuda a la toma de decisiones. Por ejemplo le damos las ventas de unos años pasados, procesa las ventas y genera un modelo, que cuando le pasemos las ventas actuales nos ayuda a identificar las relaciones y patrones que nos ayuda a visualizar a donde nos dirigimos, es decir, si le pasamos ventas proyectadas a futuro este nos dice que va a pasar, si se va a comportar igual, etc.
      BigQuery es una buena herramienta debido a que con un lenguaje similar a SQL pero con mas funcionalidades nos permite ademas de hacer consultas, almacenarla y alimentarla a un algoritmo de modelos de ML que con el mismo lenguaje SQL al ejecutarlo estamos creando modelos que nos ayudaran a predecir valores futuros.
  • Data Science: Es aplicar todo lo que hemos visto, tecnicas de ETL, Data Mining, Business Intelligence. Aunque esta mas dirigida a personas con background de estadisticas, hoy en dia tambien participan personas con el perfil de Data Engineering. Al hacer Data Science estamos aplicando todo lo visto en los temas anteriores, no solo a nivel tecnico sino que desarrollamos la experiencia y conocimientos sobre las distintas tecnologias, en que parte del desarrollo de nuestro proyecto tenemos que utilizarlas, etc. Con lo cual el Data Science juega el papel de manager dentro de un equipo de profesionales de datos.

Les comparto mis apuntes de toda la seccion Bases de datos en la vida real. Espero les sirva 😄 ❤️




Fue un placer aprender a su lado compañeros 💚. Gracias Israel

Uno de los mejores cursos que he tomado en PLATZI!!

Una pequeña infografia

Israel es un gran profesor. De los mejores de Platzi.

Boss: Necesito un data scientist para que mi empresa se vea cool!!!

Que agradable haber hecho el curso con tu forma de explicar.

La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas

El mejor profesor de platzi

Vaya, entonces el data scientist es aquel profesional que sabe de data mining, ETL, data warehouse, etc como el full-stack developer que es aquel profesional que sabe de backend y frontend

Dataismo! jajaja

Data Science, es un científico de datos que toma todos la información de una compañía y usando todas las técnicas conocidas, lograr obtener información para la toma de decisiones.

Felicitaciones profe, este módulo me aclaró mucho conceptualmente.

De verdad estas clases motivan a nunca parar de aprender. Te generan una curiosidad tan grande al ver el gran universo de posibilidades donde puedes aplicar los conocimientos que aprendemos, que de verdad es un reto enfocarse en ir aprendiendo todo carrera carrera, sin que quieras ir a explorar otras cosas.

Que buen profe que es Israel

DATA SCIENCE:

De una entrevista a varios data scientists que vi hace poco, coincidían en que los roles principales de estos profesionales en DS son:

  1. Los que trabajan haciendo estadística inferencial que van más con el diseño de experimentos, pruebas de validación de nuevos features de los productos y cosas por el estilo y trabajan cerca de un full-stack team.

  2. Los que trabajan aplicando técnicas como ML para crear algoritmos de recomendación o clasificación.

  3. Los que hacen analytics, buscando tendencias y generando insights para gerencias.

D A T A I S M O

49. Mis apuntes sobre: “Data Science”

Es aplicar todo lo que vimos, y saber cuándo aplicar cada cosa.
Existen: Data Scientist y Data Engineer.

Un Data Scientist es un experto en Data Science que resuelve problemas complejos de diferentes disciplinas (finanzas, marketing, ciencias de la vida, industria…) haciendo uso del análisis de datos (principalmente con herramientas estadísticas e informáticas) y ayuda a la extracción de conclusiones.

Notas: el Data Science: son profesionales que tienen como base de su conocimiento la estadísticas y ciencias duras, quienes aplican las técnicas de Datos, como Data Engineer, quienes son los mas técnicos en el proceso de manipulación de la data, estos también hacen parte de los Data Science actualmente, ahora además son parte del Rol Manager dentro de un equipo de profesionales de los datos

Este es uno de los mejores cursos que tiene Platzi. Personalmente para mi el mejor curso.

shoutout a Israel que es un crack!!

Para los interesados en data science, en platzi esta la escuela: https://platzi.com/datos/

Uno de los mejores profesores!

La ciencia de datos permite la extracción de conocimientos prácticos a partir de datos a gran escala. Aquí, lo contextualizamos como un término general, que abarca varios subdominios dispares. Nos enfocamos en cómo la genómica encaja como un subdominio de aplicación específico, en términos de marcos de procesos conocidos de 3 V y 4 M (volumen-velocidad-variedad y medición-minería-modelado-manipulación, respectivamente). Analizamos más a fondo las “exportaciones” e “importaciones” técnicas y culturales entre la genómica y otros subdominios de la ciencia de datos (por ejemplo, astronomía). Finalmente, discutimos cómo el valor, la privacidad y la propiedad de los datos son problemas urgentes para las aplicaciones de ciencia de datos, en general, y son especialmente relevantes para la genómica, debido a la naturaleza persistente del ADN.

Data Science es aplicar todas las técnicas de procesamiento de datos. En su manera más pura tiene que ver con gente con un background de estadísticas y ciencias duras.

Muchas gracias Israel por transmitirnos tu conocimiento, los temas, la metodología y cada uno de los conceptos fueron clave para mi aprendizaje, recordé conceptos y adquirí nuevos conocimientos. Excelente curso.

Muy buena clase. Soy ing. electricista que por necesidad he venido trabajando en base de datos relacionados a mi especialidad. Todos los conocimientos del curso han ayudado a exclarecer cosas que sabía un poco, pero me ha abierto el panorama a nuevas cosas que iré aprendiendo.

Excelente curso!!!

Llegué a Platzi queriendo ser un experto en programación para el desarrollo Web específicamente, pero me di cuenta que gracias al amor que le tengo a las estadísticas y en general las matematicas que vi en la universidad, realmente vine a Platzi a salir como un Data Scientist y dominar el Machine Learning. Qué gran curso para iniciar en este universo.

Data Science: Aplicar todos las técnicas de procesamiento de datos, complementarlas entre ellas y armar un proceso completo de trabajo en base a los datos

Comparto mi resumen con respecto al bloque - BD en la vida real-
○ Big Data: Conjunto de datos tan grandes y complejos que supera la capacidad del software convencional para ser capturados, administrados y procesados en un tiempo razonable.

○ Data Warehouse: Almacén de datos, colección de datos orientada  a un determinado ámbito empresarial, se usa para realizar informes y análisis de datos.

○ Data Mining: Minería de datos, proceso en el que se intenta descubrir patrones en grandes volúmenes de conjunto de datos para sacar información útil. Utilizado en inteligencia artificial, aprendizaje autónomo, estadística y SBD

○ ETL: Extraer, Transformar y cargar. Permite mover datos desde múltiples fuentes, reformatearlos y limpiarlos para cargar a otra BD para su análisis. 

○ Business Intelligence: Inteligencia empresarial. Conjunto de estrategias enfocados a la administración y creación por medio del análisis de datos existentes. 

○ Machine Learning: Aprendizaje automatizado. Desarrollar técnicas que permitan que la computadora aprenda a partir de datos debidamente procesados con el fin que se obtengan nuevos nuevos patrones, se utilizan sentencias BigQuery para almacenarlas en los algoritmos

○ Data Science: Ciencia de datos. Es el pro, crack, maquina, capo, duro, pepa, genio, tesos de los mas tesos en el manejo de métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas

BRUTAL!

Una carrera del futuro

Excelente profesor! Todo bien explicado de principio a fin.

Dataismo!!! encontre mi religion 😉

Gigante Israel. 1000 Gracias!

Me interesa mas el aspecto de matemático y estadistico, el aspecto de elegir modelos y ajustarlos, pero eso de data mining, etl y en general el proceso de limpiar los datos no me motiva xD

Data Science/ Data Engineering
Aplicación de de todas las herramientas vistas hasta ahora. Con gran conocimiento del manejo de bases de datos y las herramientas matemáticas necesarias para el tratamiento de datos. Es quien coordina el proyecto

Comparto la definicion de Wikipedia:
"Data science is an inter-disciplinary field that uses scientific methods, processes, algorithms and systems to extract knowledge and insights from many structural and unstructured data. Data science is related to data mining, machine learning and big data

  • Data engineering, personificación del individuo que va aplicar todas las técnicas anteriormente mencionadas, es un manager, coordina todo un proyecto de datos.

  • No tomo decisiones sin datos certeros

Realmente el perfil profesional de Data Science es el mas buscado en todas las empresas basados en datos. Aunque ya hay otros roles que se van creando tal como PMO, CDO y otros.

Muchas empresas hoy en día buscan Data Scientist sin saber qué es un Data Scientist!
Creo que hay un perfil distinto -o así lo veo yo- que sería el “Full Stack Data”

Muchas gracias por aclararme la definición de Data Science instructor Israel, al principio yo creía que era la rama de la ciencia que solo manejaba datos científicos y se almacenaban en una computadora, pero ahora sabemos que también se emplean en las empresas.
 
Al contratar Data Scientists serán empleados principalmente como gerentes porque conocen las distintas técnicas de procesamiento de datos y al saber esto pueden crear el equipo ideal para manejo de datos de la empresa.

Muchos algoritmos de Machine Learnig ya existen y son muy usados en la industria. Lo que hace el Data Science es, entre otras cosas, saber cuándo utilizar uno u otro.

muy buen curso, reforce muchos temas visto ya en la universidad y a entender temas que solo vi y aprobe por aprobe pero que en su momento no vi lo importante que son. Muchas gracias Israel

Roles que cumple un Data science:

  • Hacer un inventario de preguntas
  • Recolectar los datos
  • Procesar los datos
  • Analizar los datos recaudados
  • Desarrollar modelos de algoritmos
  • Diseñar nuevas estrategias

Data Science

Master en las técnicas de procesamiento de datos. Ataca problemas y genera soluciones basándose en la data. Toma decisiones asertivas.

Data Science
Procesamiento de datos, segmentación de información de acuerdo con intereses relevantes e implementación de distintas metodologías para luego transformar en conocimiento aplicable en la toma de decisiones para mejorar el presente y proyectar de cara al futuro.

Partes de las demás areas que llega abarcar Data Science

Un excelente curso, gracias, Israel.

It’s one of my objetives!

Muchas gracias por la información!!

Muy buena clase, gracias por la explicacion.

Gracias

los datos realmente me apasionan, estos conocimientos me han permitido darle un nuevo sentido a mi trabajo diario en logistiica .

Gracias!!! me has aclarado el panorama y de forma muy didáctica!!!

interesante!
★★★★★

Buenardo el curso, me encantó

Data Science: se convierte en la personificación del rol que tiene en su background todas las habilidades anteriormente señaladas, además de matemáticas, estadística e ingeniería. Puede jugar el papel de manager y coordinar el gran proyecto de transformar la data en cosas de valor para el negocio.

  • Aplica todo lo visto hasta el momento.
  • Aplica todo lo visto a nivel técnico y se debe saber cuando emplear las diferentes herramientas.

DATA SCIENCE
.
Data Science es una disciplina que engloba las técnicas de Big Data, Data Warehouse, Data Mining, ETL, Business Intelligence y Machine Learning juntas.
.
El perfil de personas que aplican a esta disciplina tienen un background en estadísticas, matemáticas entre otras ciencias. Sin embargo en la actual se encuentra complementado con otras disciplinas como** Data Engineerin**g que tiene que ver con la transformación de los datos.
.
Data scientist también aplica el rol de Manager ya que es quien lleva el conocimiento y proyectos a la practica.

**hola a todos **
_Platzi lanzo un reto llamado datacademy que fue todo un éxito y muchos estuvimos allí, yo en particular cuando entre a esta maravillosa escuela no sabía que ruta e en escoger en este maravilloso mundo de los datos, por este reto la ruta que mas me gusto y se ajusto a mis necesidades fue data Science, ese reto fue una gran experiencia, que me abrió las puertas a este maravilloso mundo de los datos _

Que tema tan interesante.

So, el data scientist es como el full stack o el ingeniero senior de las disciplinas de datos. Construye un dream team dataista y coordina. Tambien sabe un poco de ml, data mining, bi, etl, etc.

El mejor curso que he tomado hasta hora en platzi todo un crack el profesor.

Data science, como su nombre indica, es la ciencia que estudia los datos. Se encarga de extraer información de grandes cantidades de datos. Data Science combina la estadística, las matemáticas y la informática para interpretar datos. El objetivo es tomar decisiones.

Data Science

Es aplicar el tratamiento de los datos con las distintas técnicas que existen, tiene que ver con la gente que tiene conocimientos de estadísticas, ciencias y matemáticas.

Muchas veces es el que lleva un cargo de liderar un proyecto para tomar las decisiones adecuadas en el mismo y obtener el personal que logre organizar este proyecto de la manera más eficiente.

Es aplicar todo lo que hemos visto, técnicas de ETL, Data Mining, Business Intelligence. Aunque esta mas dirigida a personas con background de estadísticas, hoy en día también participan personas con el perfil de Data Engineering. Al hacer Data Science estamos aplicando todo lo visto en los temas anteriores, no solo a nivel técnico sino que desarrollamos la experiencia y conocimientos sobre las distintas tecnologías, en que parte del desarrollo de nuestro proyecto tenemos que utilizarlas, etc. Con lo cual el Data Science juega el papel de manager dentro de un equipo de profesionales de datos.

Author: Cesar Gonzalez — Estudiante de Platzi

El perfil del data scientist es al que espero llegar antes de 2 años.

Los datos son considerados como el petróleo del siglo XXI.

Uno de los mejores cursos que tome de manera virtual. Un crack el profe!

Un data scientist es el mejor en estadística que cualquier programador, y mejor programador que cualquier estadístico. 😃!

Dataismo --> no tomo decisiones si no es con datos certeros ,jeje

Muy buena la explicación !!!

El mejor profe explicando siempre tan claro!

Creo que de ahora en adelante seré fiel siguiente del Dataísmo*

Excelente explicación

muchas gracias por compartir sus buenos conocimientos.

Excelente curso aprendí muchísimo. Mil gracias Israel Vázquez

Muy buena teoría para aclarar los conceptos.

Gracias profe. X las clases. Me gustó el curso. Espero regresé con mas cursos

Definitivamente un personaje como estos no puede faltar en una companía. Bendito sea el dataísmo.

¡Todas las clases fueron muy bien explicadas!

Muy buena info!

Alguna vez escuche que los Data Scientist, son escasos, son unicornios >.<

Excelente, a mi me daba cierto miedito estudiar Machine Learning, pero con todo lo que has explicado, dan ganas de estudiarlo!

Toda la serie de videos en esta sección es genial y necesaria para aclarar el panorama de hacia donde ir profesionalmente. Me encantó, gracias!

Buen curso, mejor profesor. 😃

Excelente información.

Demasiado bueno este curso !!!

Que mejor que juntar matematicas y programación.

muy buen profesor

Ahora tengo una visión más clara de lo que realmente es Data Science y sus procesos.

Que pasión por los datos, muy buenos conceptos

dataismo jaja

Excelente profesor, excelente curso y excelentes explicaciones.