Justificación y contexto de tu proyecto

1

Cómo crear tu proyecto de ciencia de datos

2

Crea proyectos para afianzar tus conocimientos en ciencia de datos

3

Cada cuánto hacer un proyecto de datos

4

Dónde sacar ideas para proyectos de ciencia de datos

5

Generar y comunicar un proyecto de datos

6

Casos: personas que ya pasaron por este camino

Quiz: Justificación y contexto de tu proyecto

Ejecutando un proyecto de ciencia de datos

7

Plantea una pregunta interesante

8

Obteniendo los datos para tu proyecto

9

Ejecutando: obteniendo los datos

10

Limpieza de la información

11

Ejecutando: limpia tu conjunto de datos

12

Explora y encuentra patrones en la información

13

Ejecutando: exploración de la información

14

Ejecutando: completando la exploración de la información

15

Enriquecimiento de los datos para análisis profundo

16

Ejecutando: enriquecimiento de los datos

17

Aplicando un modelo de machine learning

18

Ejecutando: aplicando un modelo supervisado de machine learning

19

Ejecutando: aplicando un modelo no supervisado de machine learning

20

Ejecutando: aplicando un modelo no supervisado de anomalías

21

Prepara tu trabajo para comunicarlo con el mundo

22

Ejecutando: prepara tu trabajo para comunicarlo con el mundo

Quiz: Ejecutando un proyecto de ciencia de datos

Comunicando los resultados

23

Por qué es importante comunicar los resultados

24

Escribiendo tu primer blogpost técnico

25

Compartiendo en comunidad con tu primera presentación

26

Cómo mejorar tu repositorio en GitHub para ciencia de datos

27

Haciendo deploy de tus modelos

28

Construyendo una aplicación full stack que consuma tu proyecto

Quiz: Comunicando los resultados

Últimos pasos

29

Elige terminar: es mejor terminado que perfecto

30

Recuerda los objetivos del proyecto: practicar y carta de presentación

31

Comparte tu proyecto

Create an account or log in

Keep learning for free! Join and start boosting your career

Aprovecha el precio especial y haz tu profesión a prueba de IA

Antes: $249

Currency
$209
Suscríbete

Termina en:

0 Días
19 Hrs
45 Min
15 Seg

Dónde sacar ideas para proyectos de ciencia de datos

4/31
Resources

How to find inspiration for data science projects?

The search for inspiration for data science projects can come from many places, especially when we have access to abundant data. This ability allows us to answer curiosities that we may not even have known we had. When starting a new project in data science, it is possible to start from two approaches: existing data or an interesting question.

Where can you find data?

  • Organizations and Consortia: Many civil society organizations and consortia share data that can be useful for your projects.
  • National Information Sources: There are platforms such as Datos Abiertos of the digital government of Colombia or datos.gov.mx, where you can access raw data, although you will need to work on its cleaning and enrichment.
  • Enterprise Databases: Sometimes companies have databases and need guidance on what to do with them. This scenario may seem idealistic, but it presents real opportunities.
  • Online Platforms:
  • Kaggle: Although not real data, they provide interesting sets to practice machine learning.
  • UCI Machine Learning Repository: This is an excellent resource for predefined data science models, although its limitations should be considered.

How to formulate interesting questions?

Generating interesting questions generally indicates prior knowledge of the subject. These questions can arise from different contexts, such as:

  • From an external partnership: external professionals or organizations may share specific questions or challenges they want to address with your data skills.
  • Real Problem Based Questions: Issues such as combating fraud, price optimization or how to improve policy information using data, need to be transformed into data questions to be effective.

How to manage the constraints of your projects?

  • Define Limits: It is crucial to put a limit on the breadth of your question. Questions that are too broad may require excessive resources and time.
  • Quick and Agile Efforts: Taking quick and agile steps to identify data constraints allows you to adjust the direction of your project as needed.
  • Modify the Approach: Have the ability to modify the question to make it more specific or general, adjusting it according to the needs of the project and the available data.

How to communicate your data science projects?

Another critical part of data science projects is effectively communicating your findings to peers or others interested in your topic. As you learn and collect information, it is vital to use tools that facilitate the dissemination of this knowledge.

This not only solidifies what you have learned, but it encourages collaboration, feedback, and ultimately helps you advance your skills as a data scientist. It is also a motivation to continue exploring and learning in this dynamic professional area.

Contributions 15

Questions 3

Sort by:

Want to see more contributions, questions and answers from the community?

Les comparto que donde vivo fue acercandome a un restaurant, en varias ocaciones, sacando diferentes conversaciones, hasta que conoci al encargado y despues de dos o tres conversaciones le pregunte si estaba utilizando algun tipo de analitica para los datos que genera el restaurant. A lo que me dijo que no, pero que alguna vez a pensado en eso. Despues le pregunte que si estaba interesado en ayudarme en un proyecto peronal, ya que estaba aprendiento sobre analitica de datos, y si podia usar datos reales de su negocio, y que posiblemente le podrian ayudar donde mejorar, Inmediatamente me dijo que si,. Y alli empezo esta historia… Prometo volver cuando logre generarle el proyecto a este cuate… No tengan miedo, salgan a la calle, creen relaciones, digan que estan estudiando y que quieren ayudar para aprender… inviertan lo que todos tenemos… Tiempo… el dinero vendra despues… Saludos, espero los motive. PD: Se que no tengo todas las destrezas todavia, pero tengo la necesidad de emprender y ahora un compromiso con alguien más que no soy yo… Saludos comunidad.

Creo que con web scraping nos podemos complementar poderosamente

Para los que esten interesados en hacer uso data de Perú, comparto enlace de la fuente oficial:

https://www.inei.gob.pe/bases-de-datos/
(seleccionar Microdatos > Por encuesta)

Tambien hay paginas para generar data aleatoria que me han servido muchisimo. Les comparto los links https://www.mockaroo.com/
y https://generatedata.com/

Para quién está interesado en trabajar con todo tipo de imágenes satelitales: Google Earth Engine es una muy buena fuente de datos
https://developers.google.com/earth-engine/datasets/

Aquí una página interesante:
The World’s Platform for Impact with AI
trabajo real (aunque no pagan) con datasets reales
https://omdena.com/

Para los alumnos de Bolivia, aquí les dejo el siguiente link:
https://ciudatos-bolivia.org/dataset

Solo venía a ver este curso por curosear, ya que estoy en ese momento de que quiero crear proyectos pero no sé muy bien por dónde empezar, pero qué curso tan enganchador.

Encontrar ideas para proyectos de ciencia de datos.

Conjuntos de datos públicos:

  • Existen numerosos repositorios en línea que ofrecen conjuntos de datos gratuitos en una variedad de campos. Algunos de los más conocidos incluyen Kaggle, UCI Machine Learning Repository y el Portal de Datos Abiertos del Gobierno. Explorar estos repositorios puede proporcionarte ideas para proyectos.

Problemas del mundo real:

  • Observa los problemas o desafíos en tu comunidad, industria o área de interés.

Competencias de ciencia de datos:

  • Participar en competencias en plataformas como Kaggle puede ser una excelente forma de encontrar proyectos.

Preguntas personales o curiosidades:

  • A menudo, las mejores ideas provienen de preguntas que tú mismo te h

Noticias y tendencias:

  • Mantente al tanto de las noticias y tendencias en tu industria o campo de interés.

Proyectos de código abierto:

  • Explora proyectos de código abierto relacionados con la ciencia de datos en plataformas como GitHub. Puedes contribuir a proyectos existentes o utilizarlos como inspiración para tus propios proyectos.

Búsqueda de patrones y tendencias:

  • Observa patrones y tendencias en la sociedad, la economía o la tecnología. Por ejemplo, el aumento de la adopción de dispositivos móviles o la pandemia de COVID-19 generaron una gran cantidad de proyectos de datos interesantes.

Ideas de visualización de datos:

  • Las visualizaciones de datos a menudo pueden inspirar proyectos. Explora galerías de visualización de datos en línea y considera cómo puedes aplicar técnicas similares a tus propios datos.

Sugerencias de mentores o colegas:

  • Si estás aprendiendo ciencia de datos o trabajando en un equipo, consulta a tus mentores o colegas.

Revisión de literatura:

  • Investiga estudios académicos y científicos en tu área de interés.

Recuerda que lo más importante es elegir un proyecto que te apasione y que esté alineado con tus objetivos de aprendizaje y tus intereses personales. La pasión por el proyecto te mantendrá motivada a medida que trabajes en él.

Si eres de Peru, esta es l pagina de datos abiertos; https://www.datosabiertos.gob.pe/

Para los que vivimos en Uruguay acá tenemos el link:
https://catalogodatos.gub.uy/

Pueden usar el dataset del covid-19 de la universidad Jhon Howkings
https://github.com/CSSEGISandData/COVID-19

Donde hay datos hay preguntas/problemas que resolver

Es importante en algo que nos guste, conozcamos mucho o poco, que nos apasione con ello nos retamos a dar solución a este reto

Dejo un link para recolectar datos de Argentina
https://www.datos.gob.ar/