Genial, me gusta la idea de reforzar lo aprendido con retos.
Introducción a la ingeniería de datos
¿Qué es ingeniería de datos? ¿Qué es Data Engineer?
Guía de retos para convertirte en Data Engineer
¿Cómo convertirte en Data Engineer?
¿Dónde ejercer como Data Engineer?
Tareas de Data Engineer: DataOPs
Quiz: Introducción a la ingeniería de datos
Herramientas del ciclo de DataOps
Agile en ingeniería de datos
Lenguajes de programación e ingeniería de software
¿Dónde y cómo escribir tu código en ingeniería de datos?
Automatización y scripting
Fuentes de datos: SQL, NoSQL, API y web scraping
Procesamiento de datos: pipelines, Apache Spark y cómputo paralelo
Automatizar los pipelines: Airflow
Containers y empaquetamiento: Docker y Kubernetes
Manejo de ambientes para datos
Testing de software y de datos
CI/CD basico
Servidores y computación en la nube para data
Reentrenamiento y control de salud de servicios
Medición de indicadores y seguimiento a proyectos
Quiz: Herramientas del ciclo de DataOps
Ejerciendo como Data Engineer
Buscando Oportunidades como Data Engineer
Evolución en el rol: ganando seniority como Data Engineer
Evolución en el rol: manager, architect, pivot
Trabajando en equipo como Data Engineer
Quiz: Ejerciendo como Data Engineer
Conclusiones
Compartir con la comunidad y seguir creciendo
Completa tu guía con los retos y certifícate
Ricardo Alanís
Lectura
¡Hola! Qué emoción tenerte en este curso donde comenzarás a formarte como toda una o un Data Engineer.
Durante las clases compartiré varios retos que son preguntas o actividades sencillas donde tendrás que investigar o compartir tu opinión o perspectiva. Para ello llevarás una guía de retos, un documento donde escribirás tus respuestas…
Para continuar con el curso descarga aquí la Guía de retos del Curso de Fundamentos de Ingeniería de Datos. ⬅️
En este documento responderás las preguntas y actividades de los retos que aparecen al final de cada clase. Además, al terminar cada módulo tendrás un espacio donde dejarás tus propias reflexiones sobre lo que has aprendido. Siéntete libre de investigar, buscar y escribir lo que hayas encontrado.
Las y los Data Engineer o Ingenieros de Datos se encargan de tomar los datos crudos de valor, para transformarlos y almacenarlos en bases de datos de analítica y disponibilizarlos a software que funciona en sistemas de producción. Para ello crean pipelines ETL y utilizan bases de datos especializadas, con los que abastecen de datos a los demás roles de un equipo de data y a sistemas de software que funcionan con datos y machine learning.
Recuerda esto que es la base de la definición de un Data Engineer. Descarga la infografía de su anatomía para que te empieces a familiarizar en el perfil en el que te convertirás. 💪🏽
Al terminar el curso comparte todos tus aprendizajes en los comentarios de la clase final. Así podrás intercambiar ideas y soluciones con toda la comunidad de data de Platzi. 🙌🏽
Aportes 36
Preguntas 1
Genial, me gusta la idea de reforzar lo aprendido con retos.
Esto fue lo que encontré sobre los conceptos de la imagen, espero sea útil 😄
Pipeline de Datos: Una pipeline de datos es una construcción lógica que representa un proceso dividido en fases. Las pipelines de datos se caracterizan por definir el conjunto de pasos o fases y las tecnologías involucradas en un proceso de movimiento o procesamiento de datos. Las pipelines de datos son necesarias ya que no debemos analizar los datos en los mismos sistemas donde se crean.
Data Warehouse: Un Data Warehouse es un almacén electrónico donde generalmente una empresa u organización mantiene una gran cantidad de información. Los datos de un data warehouse deben almacenarse de forma segura, fiable, fácil de recuperar y fácil de administrar.
Data Lake: Es un sistema o biblioteca de datos almacenados en su formato bruto, usualmente blobs o ficheros
ETL: es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio.
Cool! Me gusta esta metodologia de los ultimos cursos de Platzi, más interactivos y que te incita a expandir el concoimiento que te da el curso 0.0
Los retos desarrollan habilidades. Excelente comienzo de curso!
UN nuevo vocabulario en esta travesía:
pipeline de datos es un conjunto de pasos y procesos secuenciales diseñados para mover, transformar y procesar datos de manera automatizada desde una fuente hasta un destino final. Es una estructura que permite la orquestación y ejecución ordenada de diversas tareas relacionadas con el flujo de datos
ETL: ETC(EXTRACT, TRANSFORM Y LOAD)
**DATALAKE: **Es un repositorio centralizado y escalable que almacena grandes volúmenes de datos en su forma original y sin procesar.
data warehouse se centra en el análisis a gran escala y la generación de informes utilizando datos consolidados de diversas fuentes. El data warehouse está diseñado para facilitar el análisis empresarial y proporcionar una vista unificada de los datos para una toma de decisiones informada.
Reto aceptado.
El obstáculo es el camino
Gracias
✅
Un mar de conocimientos los de los Data Engineer pero de eso se trata de ser master en la materia.
vgcjmckl
Me esta gustando demasiado este curso****
Hermosa aventura la de ser Data Engineer.
A por ello.
No encontré en LinkedIn algo relacionado con un monto de percepción monetaria (puede ser que no sepa buscar esto). Pero si vi bastante demanda. Piden eventualmente un mar de conocimientos entre los que siempre destaca Inglés fluido y SQL parejo.
Acepto el reto, siento que el curso me va a servir para complementar todo lo que he aprendido de forma empírica en este mundo de la Ingeniería de Datos
Te amo mucho profe que esta pendiente de todos y dice “chi”
A convertirnos en Ingenieros de Datos! 🛠
Muy buena la incorporación de la guía de retos
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?