Justificaci贸n y contexto de tu proyecto

1

C贸mo crear tu proyecto de ciencia de datos

2

Crea proyectos para afianzar tus conocimientos en ciencia de datos

3

Cada cu谩nto hacer un proyecto de datos

4

D贸nde sacar ideas para proyectos de ciencia de datos

5

Generar y comunicar un proyecto de datos

6

Casos: personas que ya pasaron por este camino

Quiz: Justificaci贸n y contexto de tu proyecto

Ejecutando un proyecto de ciencia de datos

7

Plantea una pregunta interesante

8

Obteniendo los datos para tu proyecto

9

Ejecutando: obteniendo los datos

10

Limpieza de la informaci贸n

11

Ejecutando: limpia tu conjunto de datos

12

Explora y encuentra patrones en la informaci贸n

13

Ejecutando: exploraci贸n de la informaci贸n

14

Ejecutando: completando la exploraci贸n de la informaci贸n

15

Enriquecimiento de los datos para an谩lisis profundo

16

Ejecutando: enriquecimiento de los datos

17

Aplicando un modelo de machine learning

18

Ejecutando: aplicando un modelo supervisado de machine learning

19

Ejecutando: aplicando un modelo no supervisado de machine learning

20

Ejecutando: aplicando un modelo no supervisado de anomal铆as

21

Prepara tu trabajo para comunicarlo con el mundo

22

Ejecutando: prepara tu trabajo para comunicarlo con el mundo

Quiz: Ejecutando un proyecto de ciencia de datos

Comunicando los resultados

23

Por qu茅 es importante comunicar los resultados

24

Escribiendo tu primer blogpost t茅cnico

25

Compartiendo en comunidad con tu primera presentaci贸n

26

C贸mo mejorar tu repositorio en GitHub para ciencia de datos

27

Haciendo deploy de tus modelos

28

Construyendo una aplicaci贸n full stack que consuma tu proyecto

Quiz: Comunicando los resultados

脷ltimos pasos

29

Elige terminar: es mejor terminado que perfecto

30

Recuerda los objetivos del proyecto: practicar y carta de presentaci贸n

31

Comparte tu proyecto

No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Ejecutando: obteniendo los datos

9/31
Recursos

Aportes 21

Preguntas 1

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

Yo estoy comenzando con mi tesis de pregrado y la estoy haciendo sobre los sistemas de energ铆a solar, uno de los retos que encontr茅 fue que el consumo el茅ctrico no es algo p煤blico, as铆 que he pensado en que las personas de manera aut贸noma tomen foto del recibo donde aparece el consumo y por medio de reconocimiento de im谩genes me extraiga esta informaci贸n.

Es retador pero emocionante, espero en alg煤n momento poder compartir los resultados con la comunidad.

Encontr茅 datos de 3 fuentes (que si las uno podr茅 contestar mi pregunta para relacionar el covid y la educaci贸n en Ecuador) y cada uno est谩 m谩s interesante que el otro:

  1. UNESCO [Educaci贸n y covid]. Dataset de cierre de centros educativos (o parcialmente abiertos) a nivel global debido al covid: https://en.unesco.org/covid19/educationresponse
  2. Gobierno de Ecuador [Educaci贸n]. Dataset hist贸rico de todos los centros educativos (hasta secundaria) que indica el n煤mero de estudiantes inscritos, reprobados y aprobados entre 2009 y 2021: https://educacion.gob.ec/base-de-datos/
  3. Repositorio de GitHub con reportes del gobierno [Covid]. Recopilaci贸n de varios datasets obtenido a partir de los informes (en PDF del Gobierno de Ecuador) de reportes de Covid 19. Se actualiza a diario: https://github.com/andrab/ecuacovid

En total saqu茅 6 datasets, hora de ponerse manos a la obra. 馃弮鈥嶁檪锔

Estoy haciendo un proyecto en el cual extraigo la informaci贸n de las publicaciones que hay en mercadolibre en la secci贸n de veh铆culos para mi pa铆s (Colombia), para crear una soluci贸n que extraiga las publicaciones que se hagan ese mismo d铆a y detecte cuales se encuentran por debajo de su valor esperado el cual se calcule con un modelo de regresi贸n

Estuve un dia entero intentando conseguir informacion sobre la red de ethereum, todos los lugares donde me metia solo me daban data historica sobre el precio, capitalizacion de mercado y poco mas, hasta que encontre que etherscan tenia una amplia variedad de datasets, por lo que tome los que yo considero mas relevantes y forme un solo dataset con toda la data necesaria para trabajar, lo adjunto aqui, quiza a alguno le pueda servir para ahorrarse los dolores de cabeza por los que pase xD.
El data set incluye los siguientes datos:

Date(UTC) UnixTimeStamp Price TxPerDay SupplyPerDay RewardPerDay Average Txn Fee (USD) BurnPerDay

https://drive.google.com/file/d/1IQ3vYW6QN3cneYu4tW_074VyIT7YCUsY/view?usp=sharing

que esta pasando con la plataforma, los videos estan muy demorados en cargar ???

Hola, basado en un comentario en una clase anterior, decid铆 revisar esta p谩gina: https://blog.jovian.ai/7-diy-data-science-project-ideas-using-personal-data-996151825944 y pues me parece una excelente idea usar mis propios datos para este proyecto. Ahora explorar茅 con mi propia base de datos de Spotify, a ver que resulta. Saludos

Yo estoy trabajando sobre algunos datasets relacionados con la Diabetes en el mundo: poblaci贸n con esta enfermedad, mortalidad relacionada, costos promedio de tratamiento por persona y costo anual por pa铆s. Estuvo relativamente f谩cil obtener la informaci贸n s贸lo que estaba seccionada por lo que hubo que combinar distintos dataframes y la parte num茅rica era de tipo string.

Les dejo el dataframe final, si encuentran alg煤n consejo que me sirva para hacer mi c贸digo m谩s limpio se los agradecer茅 mucho.

https://colab.research.google.com/drive/1VFjzqeAMU8jGt07y8K2DgoukMINyAXz6?usp=sharing

Mi proyecto lo estoy realizando desde la base de datos del policl铆nico que estoy trabajando, por lo cual para el conjunto de datos de ventas encuentro con el problema de las cabeceras y combinaciones de celdas ya que al exportarle se exporta en un Excel, sin embargo he encontrado otra forma de encontrar a mas detalles (pero data mas cruda) los datos que ayudaran pero si lo encuentro estructurado de otra manera que dificulta el facil entendimiento.

Hola, qu茅 tal les comparto mi proyecto de caso de estudio.

Trata acerca de la sustentabilidad en los tipos de t茅cnicas aplicadas para la siembra y cosecha de ca帽a de az煤car en M茅xico.

Les comparto mi proyecto en Kaggle

necesito filtrar en las tablas de nalimov el conjunto de movimientos posibles en cierta posici贸n dada en el ajedrez, para conocer si el movimiento de un rey de ajedrez de x casilla a y casilla es posible

El problema que se me ocurri贸 la clase pasada fue el siguiente.
驴Existe una correlaci贸n y luego una causaci贸n entre el conocimiento en conceptos ambientales vr los indicadores de cuidado ambiental? Pienso, que una primera aproximaci贸n para resolver la pregunta problema puede ser determinar una relaci贸n r谩pida entre nivel educativo de lugares en mi pa铆s. (datos estad铆sticos en educaci贸n en ciencia, que si los hay por parte del ministerio). comparada con datos de indicadores ambientales. que la pagina de mi pa铆s la pagina esta ca铆da. 馃槮 ) Seguramente estos datos estas sesgados porque abr铆a muchas variables que no deben relacionar unas con la otro鈥 Luego de hacer esto se me ocurre. Una **segunda aproximaci贸n ** podr铆a ser determinar a partir de una prueba de AB/ testing dos muestras de poblaciones con un nivel de educaci贸n similar a partir de datos de marketing鈥 realizando encuestas de conocimiento con respecto a procesos de preocupaci贸n ambiental. Se me ocurre. Pero no se. Creo que es muy abierta la pregunta todav铆a. Pero si alguien, a partir de la pregunta que realizo puede tener una idea mejor para enfocar esta pregunta me encantar铆a escucharla
??

trabajar茅 con una data de la compa帽ia, uno de los problemas mas grande te puedo tener es la cantidad de datos vacios o nulos que posee.

Me gusta mucho la idea de Ciencia de Datos para hacer el bien, se puede contribuir a mejorar la vida a muchas personas 馃槉

http://portal.monterrey.gob.mx/transparencia/Oficial/Index_Proveedores_Contratistas.asp

Para la gente que viene de Bolivia encontr茅 esta p谩gina que tiene algunos datasets bastante interesantes algo antiguos (2016,2015) pero con motivo de practicar se me hacen una buena opci贸n.
https://ciudatos-bolivia.org
Estoy bastante emocionado de trabajar con datos de mi pa铆s, he estado esperando este curso desde que comenc茅 con la carrera de Data Scientist y hasta ahora no me a decepcionado

Me encuentro investigando y haciendo un proyecto acerca del sector aeroespacial en Mexico, basado encontrar como poder tener una mayor participacion de empresas mexicanas en ese sector de la industria pero participar con innovacion para ganar terreno en el sector como una estrategia de desarrollo economico para el pais

Yo quiero saber cuantos requerimientos de atenci贸n tiene cada empleado , para eso tengo que exportar los datos en formato excel del sistema que se tiene en la empresa, ademas quiero saber cuanto demora en atender cada requerimiento, la cual tendre que buscar la fecha en que se le asigno y la fecha que esta entregando su informe final, eso tendre que buscar en el sistema para luego estar tabulandolo

Encontr茅 un reto y es que no encontr茅 un indice que agrupe el valor de la energ铆a a nivel global, por lo que debo de extraer el precio por tipo de producci贸n (Petr贸leo, gas, etc) de manera independiente