Justificación y contexto de tu proyecto

1

Cómo crear tu proyecto de ciencia de datos

2

Crea proyectos para afianzar tus conocimientos en ciencia de datos

3

Cada cuánto hacer un proyecto de datos

4

Dónde sacar ideas para proyectos de ciencia de datos

5

Generar y comunicar un proyecto de datos

6

Casos: personas que ya pasaron por este camino

Quiz: Justificación y contexto de tu proyecto

Ejecutando un proyecto de ciencia de datos

7

Plantea una pregunta interesante

8

Obteniendo los datos para tu proyecto

9

Ejecutando: obteniendo los datos

10

Limpieza de la información

11

Ejecutando: limpia tu conjunto de datos

12

Explora y encuentra patrones en la información

13

Ejecutando: exploración de la información

14

Ejecutando: completando la exploración de la información

15

Enriquecimiento de los datos para análisis profundo

16

Ejecutando: enriquecimiento de los datos

17

Aplicando un modelo de machine learning

18

Ejecutando: aplicando un modelo supervisado de machine learning

19

Ejecutando: aplicando un modelo no supervisado de machine learning

20

Ejecutando: aplicando un modelo no supervisado de anomalías

21

Prepara tu trabajo para comunicarlo con el mundo

22

Ejecutando: prepara tu trabajo para comunicarlo con el mundo

Quiz: Ejecutando un proyecto de ciencia de datos

Comunicando los resultados

23

Por qué es importante comunicar los resultados

24

Escribiendo tu primer blogpost técnico

25

Compartiendo en comunidad con tu primera presentación

26

Cómo mejorar tu repositorio en GitHub para ciencia de datos

27

Haciendo deploy de tus modelos

28

Construyendo una aplicación full stack que consuma tu proyecto

Quiz: Comunicando los resultados

Últimos pasos

29

Elige terminar: es mejor terminado que perfecto

30

Recuerda los objetivos del proyecto: practicar y carta de presentación

31

Comparte tu proyecto

32

Share sessions y office hours: comparte y asesorate de tu proyecto

Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Ejecutando: obteniendo los datos

9/32
Recursos

Aportes 8

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Yo estoy comenzando con mi tesis de pregrado y la estoy haciendo sobre los sistemas de energía solar, uno de los retos que encontré fue que el consumo eléctrico no es algo público, así que he pensado en que las personas de manera autónoma tomen foto del recibo donde aparece el consumo y por medio de reconocimiento de imágenes me extraiga esta información.

Es retador pero emocionante, espero en algún momento poder compartir los resultados con la comunidad.

Encontré datos de 3 fuentes (que si las uno podré contestar mi pregunta para relacionar el covid y la educación en Ecuador) y cada uno está más interesante que el otro:

  1. UNESCO [Educación y covid]. Dataset de cierre de centros educativos (o parcialmente abiertos) a nivel global debido al covid: https://en.unesco.org/covid19/educationresponse
  2. Gobierno de Ecuador [Educación]. Dataset histórico de todos los centros educativos (hasta secundaria) que indica el número de estudiantes inscritos, reprobados y aprobados entre 2009 y 2021: https://educacion.gob.ec/base-de-datos/
  3. Repositorio de GitHub con reportes del gobierno [Covid]. Recopilación de varios datasets obtenido a partir de los informes (en PDF del Gobierno de Ecuador) de reportes de Covid 19. Se actualiza a diario: https://github.com/andrab/ecuacovid

En total saqué 6 datasets, hora de ponerse manos a la obra. 🏃‍♂️

Hola, basado en un comentario en una clase anterior, decidí revisar esta página: https://blog.jovian.ai/7-diy-data-science-project-ideas-using-personal-data-996151825944 y pues me parece una excelente idea usar mis propios datos para este proyecto. Ahora exploraré con mi propia base de datos de Spotify, a ver que resulta. Saludos

Me encuentro investigando y haciendo un proyecto acerca del sector aeroespacial en Mexico, basado encontrar como poder tener una mayor participacion de empresas mexicanas en ese sector de la industria pero participar con innovacion para ganar terreno en el sector como una estrategia de desarrollo economico para el pais

Yo estoy trabajando sobre algunos datasets relacionados con la Diabetes en el mundo: población con esta enfermedad, mortalidad relacionada, costos promedio de tratamiento por persona y costo anual por país. Estuvo relativamente fácil obtener la información sólo que estaba seccionada por lo que hubo que combinar distintos dataframes y la parte numérica era de tipo string.

Les dejo el dataframe final, si encuentran algún consejo que me sirva para hacer mi código más limpio se los agradeceré mucho.

https://colab.research.google.com/drive/1VFjzqeAMU8jGt07y8K2DgoukMINyAXz6?usp=sharing

Yo quiero saber cuantos requerimientos de atención tiene cada empleado , para eso tengo que exportar los datos en formato excel del sistema que se tiene en la empresa, ademas quiero saber cuanto demora en atender cada requerimiento, la cual tendre que buscar la fecha en que se le asigno y la fecha que esta entregando su informe final, eso tendre que buscar en el sistema para luego estar tabulandolo

Encontré un reto y es que no encontré un indice que agrupe el valor de la energía a nivel global, por lo que debo de extraer el precio por tipo de producción (Petróleo, gas, etc) de manera independiente