Justificación y contexto de tu proyecto

1

Cómo crear tu proyecto de ciencia de datos

2

Crea proyectos para afianzar tus conocimientos en ciencia de datos

3

Cada cuánto hacer un proyecto de datos

4

Dónde sacar ideas para proyectos de ciencia de datos

5

Generar y comunicar un proyecto de datos

6

Casos: personas que ya pasaron por este camino

Quiz: Justificación y contexto de tu proyecto

Ejecutando un proyecto de ciencia de datos

7

Plantea una pregunta interesante

8

Obteniendo los datos para tu proyecto

9

Ejecutando: obteniendo los datos

10

Limpieza de la información

11

Ejecutando: limpia tu conjunto de datos

12

Explora y encuentra patrones en la información

13

Ejecutando: exploración de la información

14

Ejecutando: completando la exploración de la información

15

Enriquecimiento de los datos para análisis profundo

16

Ejecutando: enriquecimiento de los datos

17

Aplicando un modelo de machine learning

18

Ejecutando: aplicando un modelo supervisado de machine learning

19

Ejecutando: aplicando un modelo no supervisado de machine learning

20

Ejecutando: aplicando un modelo no supervisado de anomalías

21

Prepara tu trabajo para comunicarlo con el mundo

22

Ejecutando: prepara tu trabajo para comunicarlo con el mundo

Quiz: Ejecutando un proyecto de ciencia de datos

Comunicando los resultados

23

Por qué es importante comunicar los resultados

24

Escribiendo tu primer blogpost técnico

25

Compartiendo en comunidad con tu primera presentación

26

Cómo mejorar tu repositorio en GitHub para ciencia de datos

27

Haciendo deploy de tus modelos

28

Construyendo una aplicación full stack que consuma tu proyecto

Quiz: Comunicando los resultados

Últimos pasos

29

Elige terminar: es mejor terminado que perfecto

30

Recuerda los objetivos del proyecto: practicar y carta de presentación

31

Comparte tu proyecto

32

Share sessions y office hours: comparte y asesorate de tu proyecto

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Limpieza de la información

10/32
Recursos

Aportes 6

Preguntas 0

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

Hice este pequeño proyecto de extraer datos de necesidades de compras de entidades públicas para analizar el texto usando NLTK, y Selenium para escraper. Viendo tu curso me has motivado a generar proyectos mas desafiantes. Les comparto el video posteado en youtube https://www.youtube.com/watch?v=nIOYAj4bS8g&ab_channel=BeatData

Poner musica es indispensable para poder disfrutarlo jaja

Jeje voy ya un par de días limpiando 6 datasets. En el camino descubrí muchas cosas que no sabía de Pandas y prácticas comunes cada que se inicia con la limpieza (por ejemplo se puede ver los tipos de datos, si hay nulos o no, el nombre de las columnas y la cantidad de registros en un solo paso con .info())

Ya empiezo a limpiar los datos. Es una tarea apasionante.

Limpiar la información es un paso inevitable en la ciencia de datos: la data inevitablemente tiene con que mejorarse.
La forma que está representada una variable no es la óptima, hay que enriquecer una variable texto, transformar una variable fecha en día, mes y año.
La limpieza nos permite conocer el conjunto de datos y saber que le falta o sobra. Es un paso de exploración muy natural. Tomate tu tiempo. Ve tutoriales.
¿Cuándo se acaba esta etapa? Cuando eres capaz de analizarla y si la respuesta que necesitas se percibe completa.
Si te atoras por más de media hora: pide ayuda o toma un descanso.

Debería haber un curso para hacer web scrapping