Curso de Ingeniería de Datos con Python

Clases del Curso de Ingeniería de Datos con Python

Instruido por:
David Aroesti
David Aroesti
Básico
5 horas de contenido
Ver la ruta de aprendizaje
Crea un Web Scrapper profesional siguiendo el flujo de trabajo de un Ingeniero de Datos
Proyecto del curso
Crea un Web Scrapper profesional siguiendo el flujo de trabajo de un Ingeniero de Datos

La base de todo el análisis de datos, son los datos, necesitas obtener datos de calidad y en este curso aprenderás a crear un proceso completo de extracción de datos, transformación, es decir limpiarlos, borrar duplicados, etc. y por último cargarlos en una base de datos y almacenarlos listos para trabajar con ellos.

Curso de Ingeniería de Datos con Python

Curso de Ingeniería de Datos con Python

Progreso del curso:0/38contenidos(0%)

Contenido del Curso
Tutoriales de estudiantes
Preguntas de estudiantes

Progreso del curso:0/38contenidos(0%)

Introducción

Material Thumbnail

Qué aprenderás sobre la ingeniería de datos

03:07 min

Archivos del curso y Slides

00:17 min

Material Thumbnail

¿Qué es la Ciencia e Ingeniería de Datos?

09:30 min

Material Thumbnail

Roles

05:43 min

Material Thumbnail

Configuración del ambiente

08:45 min

Material Thumbnail

Jupyter Notebooks

06:09 min

Material Thumbnail

Profundizando en tipos de datos

09:55 min

Web scraping

Material Thumbnail

Introducción a las tecnologías web

08:25 min

Material Thumbnail

Realizar solicitudes HTTP con Python

07:40 min

Material Thumbnail

¿Cómo trabajar con un documento HTML?

06:53 min

Material Thumbnail

Analizando un sitio web para encontrar las directivas a utilizar al hacer un web scrapping

05:54 min

Material Thumbnail

Solicitudes a la web: Requests

02:59 min

Material Thumbnail

Implementando nuestro web scrapper: Configuración

13:51 min

Material Thumbnail

Implementando nuestro web scrapper: Obteniendo enlaces del front page

11:32 min

Material Thumbnail

Implementando nuestro web scrapper: Obteniendo artículos

09:07 min

Material Thumbnail

Obtención de datos del Artículo

17:14 min

Material Thumbnail

Persistiendo la información "scrapeada"

10:24 min

Pandas

Material Thumbnail

Introducción a Pandas

03:35 min

Material Thumbnail

Estructura de datos: Series

06:38 min

Material Thumbnail

Estructura de datos: DataFrames

05:24 min

Material Thumbnail

Índices y selección

13:48 min

Material Thumbnail

Data wrangling con Pandas

10:42 min

Material Thumbnail

Creación de la receta: preparando la automatización

17:15 min

Material Thumbnail

¿Cómo trabajar con datos faltantes?

11:13 min

Material Thumbnail

Operaciones con Series y DataFrames

05:57 min

Material Thumbnail

Limpiando detalles adicionales

09:57 min

Material Thumbnail

Limpiando detalles en nuestro proyecto

10:13 min

Material Thumbnail

Enriquecimiento de los datos

10:41 min

Material Thumbnail

Valores duplicados en Jupyter

05:35 min

Material Thumbnail

Valores duplicados en Python

09:00 min

Material Thumbnail

Visualización de datos

11:27 min

Intro a Sistemas de Datos

Material Thumbnail

Introducción a los sistemas de datos

04:56 min

Material Thumbnail

Automatización del Pipeline

15:04 min

Material Thumbnail

Cargando datos a SQLite

15:23 min

Contenido Bonus

Material Thumbnail

¿Por qué usar la nube?

04:06 min

nuevosmás votadossin responder
Ernesto Lebni Miranda Escobar
Ernesto Lebni Miranda Escobar
Estudiante

estimado equipo de platzi, creé una api del scrapper con flask para transferir info a una web app, sin embargo, cuando programé la funcionalidad de correr el scrapper en reacción al verbo put, el pipeline me corre perfectamente y me guarda los archivos, pero cuando mando la api a producción y hago put para actualizar los archivos, los archivos se me eliminan y el scrapper no corre a como lo había programado y corrido de manera local, Qué sugieren?

1
Leslor
Leslor
Estudiante

Me muestra el siguiente Error: Capture.PNG

Alguién sabe a que se deba?

0
Andrés Xavier Vargas Vera
Andrés Xavier Vargas Vera
Estudiante

Estoy teniendo un problema al ingresar a la web de “el universal”, debido a que me aparece que retorna un codigo de status 403. A alguien le ha sucedido?

1
Mauricio Cruz
Mauricio Cruz
Estudiante

Una serie sería como un diccionario pero con restricción en el tipo de dato?

1
Mauricio Cruz
Mauricio Cruz
Estudiante

Ejecuté esto en Colab pero no me mostró nada:
Image(‘mysql_table_example.png’)

Qué era, una foto o una tabla del tipo base de datos?

2
JUAN ANDRES VILLADA
JUAN ANDRES VILLADA
Estudiante

Como podemos copiar y pegar de la web al vim?

1
FABIAN RICARDO
FABIAN RICARDO
Estudiante

¿Podría implementar la metodología Page Object Pattern con yaml en el archivo config para poder guardar mis queries pero usando xpath y así poder localizar los nodos dentro del archivo html?

1
telavin
telavin
Estudiante

Muchachos una pregunta como hago para extraer lo que está resaltado en amarillo?, ya que con las etiquetas solo he podido extraer : " wells-fargo-bank-n-a" y necesito es mostrar el valor resaltado en amarillo

Imagen

pregunta.PNG

Gracias!

2
Ramiro José Bamaceda Janne
Ramiro José Bamaceda Janne
Estudiante

Alguien sabe como automatizar la ejecución de esos archivos en linux y que se ejecuten en primer plano?

1
Bryan Enmanuel Espinales Coronado
Bryan Enmanuel Espinales Coronado
Estudiante

¿Cuál sería la diferencia ente una lista de Pandas y vector de Numpy?

1