Justificación y contexto de tu proyecto

1

Cómo crear tu proyecto de ciencia de datos

2

Crea proyectos para afianzar tus conocimientos en ciencia de datos

3

Cada cuánto hacer un proyecto de datos

4

Dónde sacar ideas para proyectos de ciencia de datos

5

Generar y comunicar un proyecto de datos

6

Casos: personas que ya pasaron por este camino

Quiz: Justificación y contexto de tu proyecto

Ejecutando un proyecto de ciencia de datos

7

Plantea una pregunta interesante

8

Obteniendo los datos para tu proyecto

9

Ejecutando: obteniendo los datos

10

Limpieza de la información

11

Ejecutando: limpia tu conjunto de datos

12

Explora y encuentra patrones en la información

13

Ejecutando: exploración de la información

14

Ejecutando: completando la exploración de la información

15

Enriquecimiento de los datos para análisis profundo

16

Ejecutando: enriquecimiento de los datos

17

Aplicando un modelo de machine learning

18

Ejecutando: aplicando un modelo supervisado de machine learning

19

Ejecutando: aplicando un modelo no supervisado de machine learning

20

Ejecutando: aplicando un modelo no supervisado de anomalías

21

Prepara tu trabajo para comunicarlo con el mundo

22

Ejecutando: prepara tu trabajo para comunicarlo con el mundo

Quiz: Ejecutando un proyecto de ciencia de datos

Comunicando los resultados

23

Por qué es importante comunicar los resultados

24

Escribiendo tu primer blogpost técnico

25

Compartiendo en comunidad con tu primera presentación

26

Cómo mejorar tu repositorio en GitHub para ciencia de datos

27

Haciendo deploy de tus modelos

28

Construyendo una aplicación full stack que consuma tu proyecto

Quiz: Comunicando los resultados

Últimos pasos

29

Elige terminar: es mejor terminado que perfecto

30

Recuerda los objetivos del proyecto: practicar y carta de presentación

31

Comparte tu proyecto

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Cómo mejorar tu repositorio en GitHub para ciencia de datos

26/31
Recursos

¿Cómo construir un repositorio de GitHub que destaque?

En la era digital, un repositorio limpio y bien documentado en GitHub puede ser la carta de presentación que abre puertas en el mundo profesional. Pero, ¿qué hace que un repositorio realmente destaque? Al igual que un currículum impecable, un buen repositorio debe cuidarse y reflejar tus habilidades, intereses y dedicación en proyectos. A través de la correcta organización y documentación, puedes demostrar no solo tus habilidades técnicas, sino también tu capacidad de compartir conocimientos y colaborar efectivamente.

¿Cuáles son los elementos esenciales de un buen repositorio?

Asegúrate de que tu repositorio incluya los siguientes elementos críticos:

  • README y Licencia: Dos componentes indispensables. El README proporciona instrucciones sobre cómo usar o contribuir al proyecto, mientras que la licencia especifica qué pueden hacer otros con tu código.

  • Organización de Archivos: Sigue un estándar como Cookiecutter Data Science para estructurar tus archivos, lo que facilita a otros navegar y contribuir.

  • Gestión de Errores y Versiones: Mantén documentados los errores conocidos y utiliza versiones para mostrar la evolución de tu proyecto.

  • Instrucciones Claras: Proporciona pasos detallados para reproducir o utilizar tu proyecto, ahorrando tiempo a otros interesados.

¿Cómo fomentar la colaboración y contribución?

Un buen repositorio no solo es un proyecto individual, sino una plataforma para que otros puedan colaborar y construir sobre tu trabajo. A continuación, algunas estrategias clave para fomentar la colaboración:

  • Establecer claramente los errores conocidos para que otros puedan ayudar en su resolución.

  • Estructura tu código de manera que sea fácil de entender y modificar, invitando a otros a participar.

  • Documentar tu trabajo de forma exhaustiva, indicando claramente cómo las personas pueden contribuir.

¿Por qué empaquetar tu proyecto?

Considera transformar tu proyecto en un paquete o una librería formal. Esto no solo lo hace más accesible, sino que también aumenta su utilidad:

  • Facilita la reutilización: Otros desarrolladores pueden incluir directamente tu código en sus proyectos.

  • Incrementa la visibilidad: Un paquete bien documentado y mantenido puede atraer considerable atención.

Transformar un proyecto en paquete fomenta la innovación y expansión del alcance de tu trabajo. No subestimes el impacto potencial que tu librería puede tener en la comunidad de desarrollo.

¿Cómo compartir y mejorar con la comunidad?

Una recomendación final y poderosa es compartir tu repositorio para recibir feedback y colaboración. Deja tu proyecto en la sección de comentarios o foros alineados a tu campo, para que otros estudiantes o profesionales puedan revisarlo, contribuir y ofrecer ayuda.

Esta apertura puede ser una valiosa fuente de inspiración y mejora continua e invita a la contribución colaborativa. De esta manera, te empoderas como un agente de cambio en el entorno tecnológico compartiendo conocimiento y fomentando el aprendizaje colectivo.

Aportes 12

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Les comparto mi Cuenta de GitHub: https://github.com/elmergustavo

Tengo varios proyectos que te pueden interesar.


Les comparto mi GitHub: https://github.com/axlyaguana11
.
Con las recomendaciones del curso estaré mejorándolo y creando más proyectos. 📊

Hola, les comparto mi cuenta de github: [caroAM22 (Carolina Álvarez ) (github.com)](https://github.com/caroAM22) Apenas estoy comenzado a realizar proyectos, espero a futuro tener más y poder contribuir con otros. ![](https://static.platzi.com/media/user_upload/image-43a2dc72-74a5-4732-971f-7864438b5561.jpg)

Estoy nuevo en esto, por lo que cualquier comentario será de gran utilidad, este es mi repositorio https://github.com/mogollonalex

Que buen tema, Nunca tratado hasta aquí!

Aqui les comparto mi GitHub :

¿Tienen alguna recomendación para el readme de mi proyecto?
https://github.com/anthonymanotoa/covid-ec

Para mejorar un repositorio de \*\*ciencia de datos\*\* en GitHub, es importante seguir una estructura clara, incluir documentación detallada y hacer uso de buenas prácticas de codificación. Aquí te doy algunas sugerencias: \### 1. \*\*Estructura clara del proyecto\*\* Organiza los archivos y carpetas para que otros puedan entender fácilmente cómo está estructurado tu proyecto: ``` ├── README.md ├── data/ # Datos crudos o procesados ├── notebooks/ # Jupyter Notebooks con análisis y visualizaciones ├── src/ # Código fuente (scripts de procesamiento, modelado, etc.) ├── models/ # Modelos guardados (si es aplicable) ├── tests/ # Pruebas unitarias para el código ├── requirements.txt # Dependencias del proyecto └── .gitignore # Archivos a ignorar (ej. datos grandes) ``` \### 2. \*\*Documentación (README.md)\*\* El archivo `README.md` es esencial para explicar tu proyecto y facilitar su uso por otros. Incluye: \- \*\*Descripción del proyecto\*\*: Explica brevemente qué hace el proyecto. \- \*\*Instrucciones de instalación\*\*: Cómo instalar las dependencias necesarias (usando `requirements.txt` o `environment.yml` para conda). \- \*\*Uso del proyecto\*\*: Ejemplos de cómo ejecutar los scripts, cargar datos o entrenar modelos. \- \*\*Estructura de los datos\*\*: Explica el formato de los archivos y las variables si estás trabajando con datos. \- \*\*Referencias\*\*: Cita recursos externos, papers o artículos que fundamenten el proyecto. \### 3. \*\*Uso de Notebooks y Scripts\*\* \- Si usas \*\*Jupyter Notebooks\*\*, asegúrate de que estén bien organizados y comentados para que cualquiera pueda seguir tu análisis. \- Evita usar Notebooks para procesos repetitivos o que puedan automatizarse. Para eso, es mejor tener scripts en la carpeta `src/`. \### 4. \*\*Pruebas unitarias\*\* \- Implementa \*\*pruebas unitarias\*\* en la carpeta `tests/` para asegurarte de que el código funcione correctamente. Puedes usar frameworks como `unittest` o `pytest`. \- Incluye un archivo `test\_requirements.txt` con las dependencias necesarias para ejecutar las pruebas. \### 5. \*\*Manejo de datos\*\* \- Si los datos son sensibles o muy grandes, no los incluyas directamente en el repositorio. Usa un servicio de almacenamiento externo o un enlace de descarga y asegúrate de incluir un archivo `.gitignore` para no versionar los archivos de datos. \- Si es posible, incluye datos \*\*de ejemplo\*\* o utiliza un dataset más pequeño para pruebas rápidas. \### 6. \*\*Control de versiones\*\* \- Usa \*\*commits descriptivos\*\* y organiza el historial de cambios con mensajes claros. \- Utiliza ramas (`branches`) para diferentes fases del proyecto, como `dev`, `feature/new-model`, `hotfix`, etc. Haz \*\*pull requests\*\* para integrar cambios en la rama principal. \### 7. \*\*Incluye un archivo LICENSE\*\* \- Añade una \*\*licencia\*\* que indique cómo puede utilizarse y compartirse tu código. Puedes elegir licencias comunes como MIT, Apache 2.0, etc. \### 8. \*\*Visualizaciones\*\* \- Incluye \*\*visualizaciones\*\* que expliquen los resultados obtenidos. Puedes exportar gráficos o tablas desde los Notebooks y almacenarlos en una carpeta `visualizations/`. \### 9. \*\*Documentación del código\*\* \- Documenta bien tu código fuente con \*\*docstrings\*\* que expliquen el propósito de cada función y clase. \- Usa \*\*type hints\*\* para hacer el código más comprensible. \### 10. \*\*Automatización con scripts o Makefiles\*\* \- Usa un \*\*Makefile\*\* o scripts de automatización (por ejemplo, `run.sh`) para facilitar tareas comunes como descargar datos, procesarlos, o ejecutar modelos. Esto ayuda a que otros puedan replicar tu análisis fácilmente. \### 11. \*\*Inclusión de badges\*\* Añade \*\*badges\*\* en tu `README.md` para mostrar el estado del proyecto: \- Status de CI/CD (Travis, GitHub Actions) \- Cobertura de pruebas \- Dependencias (PyPI) \- Licencia \### 12. \*\*GitHub Actions para CI/CD\*\* Configura \*\*GitHub Actions\*\* para automatizar pruebas y despliegue: \- Realiza \*\*tests automáticos\*\* en cada push o pull request. \- Puedes implementar pipelines que verifiquen que el código funciona antes de fusionar ramas. \--- Siguiendo estos pasos, mejorarás la claridad y profesionalismo de tu repositorio, lo que facilitará la colaboración y el uso por parte de otros científicos de datos.

Holaa, soy analista de datos en una empresa de marketing, adjunto mi repo, cualquier comentario es bien recibido. muchas gracias.

https://github.com/davidCardenas861

Me gustaría compartirles mi GitHub, en especial por un proyecto que me interesa bastante sobre la implementar inteligencia artificial en la agricultura.
https://github.com/DurangoFon

Les comparto mi Cuenta de GitHub:
.
https://github.com/Todointerconectado
.

Les comparto mi GitHub: https://github.com/santiagoahl