Justificación y contexto de tu proyecto

1

Cómo crear tu proyecto de ciencia de datos

2

Crea proyectos para afianzar tus conocimientos en ciencia de datos

3

Cada cuánto hacer un proyecto de datos

4

Dónde sacar ideas para proyectos de ciencia de datos

5

Generar y comunicar un proyecto de datos

6

Casos: personas que ya pasaron por este camino

Quiz: Justificación y contexto de tu proyecto

Ejecutando un proyecto de ciencia de datos

7

Plantea una pregunta interesante

8

Obteniendo los datos para tu proyecto

9

Ejecutando: obteniendo los datos

10

Limpieza de la información

11

Ejecutando: limpia tu conjunto de datos

12

Explora y encuentra patrones en la información

13

Ejecutando: exploración de la información

14

Ejecutando: completando la exploración de la información

15

Enriquecimiento de los datos para análisis profundo

16

Ejecutando: enriquecimiento de los datos

17

Aplicando un modelo de machine learning

18

Ejecutando: aplicando un modelo supervisado de machine learning

19

Ejecutando: aplicando un modelo no supervisado de machine learning

20

Ejecutando: aplicando un modelo no supervisado de anomalías

21

Prepara tu trabajo para comunicarlo con el mundo

22

Ejecutando: prepara tu trabajo para comunicarlo con el mundo

Quiz: Ejecutando un proyecto de ciencia de datos

Comunicando los resultados

23

Por qué es importante comunicar los resultados

24

Escribiendo tu primer blogpost técnico

25

Compartiendo en comunidad con tu primera presentación

26

Cómo mejorar tu repositorio en GitHub para ciencia de datos

27

Haciendo deploy de tus modelos

28

Construyendo una aplicación full stack que consuma tu proyecto

Quiz: Comunicando los resultados

Últimos pasos

29

Elige terminar: es mejor terminado que perfecto

30

Recuerda los objetivos del proyecto: practicar y carta de presentación

31

Comparte tu proyecto

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Enriquecimiento de los datos para análisis profundo

15/31
Recursos

Aportes 5

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Resumen:

  • Esta etapa puede o no existir.
  • Enfócate en el problema. El tema debe estar en el centro junto a su contexto.
  • Limpia y luego enriquece. Si no, puedes terminar ensuciando más tu dataset.
  • Decide terminar. A veces esta etapa puede ser infinita.
  • Puedes comenzar proyectado variables numéricas a categóricas.
  • Complementa la definición de los elementos descritos.

A ti que miras este mi comentario, quiero decirte que estas a mitad de camino de este gran curso y te felicito. Te comparto que no será la primera vez q lo vea y espero que lo disfrutes tanto como yo lo hago.

Mientras trabajamos nos vamos dando cuenta que la nuestra información puede estar mejor explicada para acercarnos a tener la respuesta a nuestro problema.
El proceso de enriquecimiento de datos es una parte del proceso de ciencia de datos. Pero puede no existir si la data es suficiente .
El contexto del problema es lo que nos empuja a enriquecer los datos que tenemos.
Primero se limpia , luego se enriquece.
Hay que enfocarse en la pregunta a responder para definir hasta donde llegamos con el enriquecimiento, pues puede ser infinito el proceso.
Como enriquecer:

  • Estadísticos de una variable numérica agrupada en una categórica. Promedio de cada tipo.
  • Estadísticos por zonas o lugares geográficas
  • Describir el contexto. Escenario y actores. Lograr poder proyectarlos en los datos.

El enriquecimiento de los datos puede ser fundamental para un análisis más profundo y significativo

Agregar Datos Externos:

Datos Geoespaciales:
Si tu conjunto de datos contiene información geográfica, puedes agregar coordenadas o datos geoespaciales para visualizaciones o análisis basados ​​en la ubicación.


Datos Demográficos:
Incorporar datos demográficos como población, ingresos por área, densidad, etc., que pueden proporcionar contexto a tus análisis.


Datos del Gobierno o Instituciones:
A menudo, los gobiernos y otras instituciones tienen datos disponibles, como estadísticas económicas, de salud, educación, etc.

Crear nuevas características:

Ingeniería de Características:
Crea nuevas características a partir de las existentes que podrían ser más informativas para tu análisis.


Análisis de Series Temporales:
Si tienes datos temporales, podrías agregar características derivadas como medios móviles, tendencias, estacionalidad, etc.

Normalización y Limpieza Adicionales:

Normalización de texto:
Si hay datos de texto, normalízalos para realizar análisis de texto.
Limpieza de Datos Faltantes:
Trata de llenar o manejar los valores faltantes de manera más precisa.

Codificación de Variables Categóricas:

Si tienes variables categóricas, considera codificarlas adecuadamente para el análisis.
Análisis de Sentimiento o Contextualización:

Análisis de sentimiento:

Si hay datos de texto, podrías realizar un análisis de sentimiento para extraer información adicional.

Contextualización de Eventos:

Si tus datos están relacionados con eventos específicos, podrías enriquecerlos con información contextual sobre esos eventos.

Integración de Conjuntos de Datos Adicionales:

Unir con Otros Datasets:
Busca otros conjuntos de datos relevantes que puedan enriquecer o complementar la información de tu dataset actual.


Fuentes Externas de Datos Abiertos:
Explora fuentes de datos abiertos que podrían aportar información valiosa a tu análisis.