Curso de Ingeniería de Datos con Python

Curso de Ingeniería de Datos con Python

Instruido por:
David Aroesti
David Aroesti
Básico
5 horas de contenido
Ver la ruta de aprendizaje
Crea un Web Scrapper profesional siguiendo el flujo de trabajo de un Ingeniero de Datos
Proyecto del curso
Crea un Web Scrapper profesional siguiendo el flujo de trabajo de un Ingeniero de Datos

La base de todo el análisis de datos, son los datos, necesitas obtener datos de calidad y en este curso aprenderás a crear un proceso completo de extracción de datos, transformación, es decir limpiarlos, borrar duplicados, etc. y por último cargarlos en una base de datos y almacenarlos listos para trabajar con ellos.

Curso de Ingeniería de Datos con Python

Curso de Ingeniería de Datos con Python

Progreso del curso:0/38contenidos(0%)

Contenido del Curso
Tutoriales de estudiantes
Preguntas de estudiantes

Progreso del curso:0/38contenidos(0%)

Introducción

Material Thumbnail

Introducción al curso

03:07 min

Archivos del curso y Slides

00:17 min

Material Thumbnail

¿Qué es la Ciencia e Ingeniería de Datos?

09:30 min

Material Thumbnail

Configuración del ambiente

08:45 min

Material Thumbnail

Jupyter Notebooks

06:09 min

Material Thumbnail

Profundizando en tipos de datos

09:55 min

Web scraping

Material Thumbnail

Introducción a las tecnologías web

08:25 min

Material Thumbnail

Realizar solicitudes HTTP con Python

07:40 min

Material Thumbnail

¿Cómo trabajar con un documento HTML?

06:53 min

Material Thumbnail

Analizando un sitio web para encontrar las directivas a utilizar al hacer un web scrapping

05:54 min

Material Thumbnail

Solicitudes a la web: Requests

02:59 min

Material Thumbnail

Implementando nuestro web scrapper: Configuración

13:51 min

Material Thumbnail

Implementando nuestro web scrapper: Obteniendo enlaces del front page

11:32 min

Material Thumbnail

Implementando nuestro web scrapper: Obteniendo artículos

09:07 min

Material Thumbnail

Obtención de datos del Artículo

17:14 min

Material Thumbnail

Persistiendo la información "scrapeada"

10:24 min

Pandas

Material Thumbnail

Introducción a Pandas

03:35 min

Material Thumbnail

Estructura de datos: Series

06:38 min

Material Thumbnail

Estructura de datos: DataFrames

05:24 min

Material Thumbnail

Índices y selección

13:48 min

Material Thumbnail

Data wrangling con Pandas

10:42 min

Material Thumbnail

Creación de la receta: preparando la automatización

17:15 min

Material Thumbnail

¿Cómo trabajar con datos faltantes?

11:13 min

Material Thumbnail

Operaciones con Series y DataFrames

05:57 min

Material Thumbnail

Limpiando detalles adicionales

09:57 min

Material Thumbnail

Limpiando detalles en nuestro proyecto

10:13 min

Material Thumbnail

Enriquecimiento de los datos

10:41 min

Material Thumbnail

Valores duplicados en Jupyter

05:35 min

Material Thumbnail

Valores duplicados en Python

09:00 min

Material Thumbnail

Visualización de datos

11:27 min

Intro a Sistemas de Datos

Material Thumbnail

Introducción a los sistemas de datos

04:56 min

Material Thumbnail

Cargando datos a SQLite

15:23 min

Material Thumbnail

Automatización del Pipline

15:04 min

Contenido Bonus

Material Thumbnail

¿Por qué usar la nube?

04:06 min

nuevosmás votadossin responder
Jean Paul Fabra Ruiz
Jean Paul Fabra Ruiz
Estudiante

Hola buenas, este es el código que empleé para sacar los Headlines, el problema es que el output sale sin la codificación UTF-8, alguna ayuda?

headlines_name = soup.select('.headline')
len(headlines_name)foriin range (len(headlines_name)):
    print('Headline {}'.format(i+1),
         headlines_name[i].text)

Ejemplo del output:
Headline 1 Tim Merlier triunfa en la primera llegada masiva; Ganna sigue líder del Giro
Headline 2 Declaran alerta roja hospitalaria en Cartagena
Headline 3 Cayó ‘Deinercito’, presunto asesino de un hombre en La Candelaria
Headline 4 Lewis Hamilton gana en Barcelona y se afianza en el liderato de la Fórmula Uno
Headline 5 “Esta es una versión mucho más musical”: Laura Londoño

0
ISABID DE JESUS GUTIERREZ PARRA
ISABID DE JESUS GUTIERREZ PARRA
Estudiante

tengo el siguiente error “ValueError: Length of passed values is 0, index implies 4.” alguien puede ayudarme. Gracias

0
Ramiro José Bamaceda Janne
Ramiro José Bamaceda Janne
Estudiante

Alguien sabe de alguna libreria para conexión FTP y otra para manipular archivos .zip??

1
Fabiotovio
Fabiotovio
Estudiante

Para mi caso que estoy viendo el curso en este momento, y la pagina de platzi no es la misma como seria el codigo?

0
Víctor Echavarría
Víctor Echavarría
Estudiante

¿Si quisiera automatizar varios Pipline y calendarizarlos… como sería?

0
César Andrés Baudi Ventura
César Andrés Baudi Ventura
Estudiante

¿Se podría hacer una especie de timer que cada vez pasado cierta hora del día, se ejecute el pipeline. py

0
Cristhian Esteban Hernández Gómez
Cristhian Esteban Hernández Gómez
Estudiante
Que diferencia abría entre un arreglo y una serie ?
0
Julian Camilo Hermida Delgado
Julian Camilo Hermida Delgado
Estudiante

Por qué me da error al importar yaml si le di la orden de instalarlo cuando cree el ambiente virtual?. Tengo el ambiente virtual activado y lo ejecuto desde el shell de Anaconda en Windows

2
Giovany samaca
Giovany samaca
Estudiante

señores
una pregunta que es una apis?
y una api rest??

3
Sergio Alonso Gutierrez Sanchez
Sergio Alonso Gutierrez Sanchez
Estudiante

‘HomePage’ object has no attribute ‘_visit’

1