¡Todos a aprender SQL! 😄
Introducción
Qué aprenderás sobre la ingeniería de datos
Archivos del curso y Slides
¿Qué es la Ciencia e Ingeniería de Datos?
Roles
Configuración del ambiente
Jupyter Notebooks
Profundizando en tipos de datos
Tipos de datos
Fuentes de datos
ETL
Web scraping
Introducción a las tecnologías web
Realizar solicitudes HTTP con Python
¿Cómo trabajar con un documento HTML?
Analizando un sitio web para encontrar las directivas a utilizar al hacer un web scrapping
Solicitudes a la web: Requests
Implementando nuestro web scrapper: Configuración
Implementando nuestro web scrapper: Obteniendo enlaces del front page
Implementando nuestro web scrapper: Obteniendo artículos
Obtención de datos del Artículo
Persistiendo la información "scrapeada"
Pandas
Introducción a Pandas
Estructura de datos: Series
Estructura de datos: DataFrames
Índices y selección
Data wrangling con Pandas
Creación de la receta: preparando la automatización
¿Cómo trabajar con datos faltantes?
Operaciones con Series y DataFrames
Limpiando detalles adicionales
Limpiando detalles en nuestro proyecto
Enriquecimiento de los datos
Valores duplicados en Jupyter
Valores duplicados en Python
Visualización de datos
Intro a Sistemas de Datos
Introducción a los sistemas de datos
Automatización del Pipeline
Cargando datos a SQLite
Contenido Bonus
¿Por qué usar la nube?
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Los sistemas de datos vienen en muchos sabores y colores, SQL, NoSQL, especializados en procesamiento en bloque, chorro y streaming. Este tipo de sistema nos permite realizar queries sofisticadas y compartir nuestro trabajo con otros miembros del equipo.
Procesamiento de bloque: Estamos hablando de datos históricos, qué sucedió ayer, en el trimestre pasado, cuáles fueron las ventas del año anterior o de los últimos cinco años. Nos permite realizar el procesamiento de manera eficiente.
Procesamiento en chorro: Significa que estamos procesando los datos conforme van llegando, las transformaciones se realizan en tiempo real, Este tipo de sistema nos sirven para cuando queremos realizar decisiones en donde la importancia del tiempo es fundamental.
El criterio principal a tener en cuenta: El tiempo que tienes. Si bien los sistemas open source son gratis, para poderlos implementar necesitas tener conocimientos de cloud, debes poder saber trabajar y mantener máquinas.
SQL vs NoSQL
Aportes 20
Preguntas 0
¡Todos a aprender SQL! 😄
Por si quieren saber un poco mas de SQL y NoSQL (de wikipedia):
SQL (por sus siglas en inglés Structured Query Language; en español lenguaje de consulta estructurada) es un lenguaje de dominio específico utilizado en programación, diseñado para administrar, y recuperar información de sistemas de gestión de bases de datos relacionales. ºUna de sus principales características es el manejo del álgebra y el cálculo relacional para efectuar consultas con el fin de recuperar, de forma sencilla, información de bases de datos, así como realizar cambios en ellas.
NoSQL (a veces llamado “no solo SQL”) es una amplia clase de sistemas de gestión de bases de datos que difieren del modelo clásico de SGBDR (Sistema de Gestión de Bases de Datos Relacionales) en aspectos importantes, siendo el más destacado que no usan SQL como lenguaje principal de consultas. Los datos almacenados no requieren estructuras fijas como tablas, normalmente no soportan operaciones JOIN, ni garantizan completamente ACID (atomicidad, consistencia, aislamiento y durabilidad) y habitualmente escalan bien horizontalmente. Los sistemas NoSQL se denominan a veces “no solo SQL” para subrayar el hecho de que también pueden soportar lenguajes de consulta de tipo SQL.
Me gusto el termino chorro para castellanizar streaming…
Por fin, mi mundo…
interesantes conceptos… no los conocia… genial aporte
Lo bueno de SQL es que es un lenguaje standard, si aprenden SQL pueden manejar POSTGREs, MySql, SQL Server, y más, varían en muy pocos aspectos.
El curso de Fundamentos de Bases de Datos, dictado por el profe Israel es excelente, super recomendado: bases de datos.
Algunas bases de datos NoSQL: MongoDB, Apache Cassandra, Apache Hbase, Apache CouchDB.
Muy buena explicacion
interesante introduccion, resumida y concreta
muy interesante!
Interesante!
nunca pares de aprender, despues que acabe toda la ruta de IA aprender bases de datos SQL, NoSQL y reforzar conocimientos.
Interesante lo que es Procesamiento de Bloque y en Chorro.
Muy interesante el tema de ésta clase. Seguiré estudiando y aprendiendo.
Excelente tema.
A este nivel de ingeniería se debe tener claro los fundamentos en BD relacionales o no, experiencia en implantación y un skill muy importante: la puesta a punto con la realidad. Me llama la atención el uso de UIDś en este curso (el profesor lo asume como buena práctica de modo implícito y está bien).
En los cursos de BD (fundamentos,PostgreSQL, MySQL) se limitan solo al ID con una explicación muy básica y alejada de la realidad de implantación de claves principales y secundarias para identificación de registros en proyectos reales.
A este nivel de ingeniería se debe tener los fundamentos en BD relacionales o no, experiencia en implantación y puesta a punto con la realidad. Me llama la atención el uso de UID en este curso y en los cursos de BD (fundamentos,PostgreSQL, MySQL) se limitan solo al ID
Que bien, gracias
Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.