Justificación y contexto de tu proyecto

1

Proyectos prácticos en ciencia de datos: del aprendizaje a la aplicación

2

Proyectos de Ciencia de Datos: Del Teórico al Práctico Realista

3

Cuándo iniciar un nuevo proyecto de ciencia de datos

4

Herramientas de Comunicación para Proyectos de Ciencia de Datos

5

Compartir Proyectos de Ciencia de Datos: Estrategias y Recursos

6

Comunicación Efectiva en Proyectos de Ciencia de Datos

Quiz: Justificación y contexto de tu proyecto

Ejecutando un proyecto de ciencia de datos

7

Construcción de Proyectos en Ciencia de Datos: Planteamiento de Preguntas

8

Búsqueda y Selección de Conjuntos de Datos Eficientes

9

Análisis de Datos Abiertos para Detectar Anomalías en Compras Públicas

10

Limpieza de Datos: Técnicas y Buenas Prácticas

11

Limpieza de Datos con Python y Pandas para Proyectos de Transparencia

12

Exploración de Datos: Análisis Unidimensional y Bidimensional

13

Análisis y Exploración de Datos con Pandas y Matplotlib

14

Análisis Multidimensional y Visualización de Datos en Python

15

Enriquecimiento de Datos en Ciencia de Datos

16

Enriquecimiento de Datos para Modelos de Machine Learning

17

Modelos de Machine Learning: Supervisado y No Supervisado

18

Modelación de Datos con Aprendizaje Supervisado y No Supervisado

19

Clustering y Detección de Anomalías en Datos de Negocios

20

Detección de Anomalías en Datos Financieros con Modelos Gaussianos

21

Organización y Versionado de Proyectos con Git y Github

22

Publicación de Proyectos en GitHub: Limpieza y Conclusiones

Quiz: Ejecutando un proyecto de ciencia de datos

Comunicando los resultados

23

Cómo Compartir Proyectos de Ciencia de Datos Efectivamente

24

Cómo Escribir un Block Post Técnico Efectivo

25

Presentaciones Efectivas en Comunidades Tecnológicas

26

Optimización de Repositorios en GitHub para Impacto Profesional

27

APIs Restful: Construcción y Despliegue Eficiente

28

Creación de Productos de Datos con Python y Herramientas Visuales

Quiz: Comunicando los resultados

Últimos pasos

29

Cómo y Cuándo Dar Cierre a Proyectos de Ciencia de Datos

30

Recomendaciones para Compartir Proyectos de Datos

31

Presentación y Compartición de Proyectos de Ciencia de Datos

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Organización y Versionado de Proyectos con Git y Github

21/31
Recursos

¿Por qué versionar es crucial en Data Science?

En el emocionante mundo del desarrollo de proyectos de Data Science, uno de los aspectos más críticos para asegurar la eficiencia y la efectividad es el versionado. Habrás experimentado, en más de una ocasión, trabajar durante horas en un proyecto para luego olvidar guardar los avances o, peor aún, sobrescribir lo que sí funcionaba. Aquí es donde entran en juego herramientas como Git y GitHub, fundamentales para cualquier profesional del área.

¿Qué beneficios nos ofrece Git y GitHub?

  • Colaboración eficiente: Ambos permiten que múltiples colaboradores trabajen en un mismo proyecto sin perder los avances de los demás.
  • Control y seguimiento: Facilitan guardar versiones anteriores de un proyecto, lo que permite rastrear cambios y restaurar versiones anteriores en caso de errores.
  • Organización y estructura: Ayudan a mantener una estructura clara dentro del proyecto, esencial a medida que los proyectos se expanden y se vuelven más complejos.

¿Cómo optimizar nuestro repositorio para un proyecto de Data Science?

Organizar de manera eficiente un repositorio es un aspecto esencial de cualquier proyecto técnico. La organización no solo facilita el acceso a la información, sino que también permite que otros entiendan y colaboren fácilmente en el proyecto.

¿Qué consideraciones tener al organizar un repositorio?

  • Referentes y estándares: Existen referencias como el proyecto Cookie Cutter Data Science, que propone una estructura organizada en carpetas que ayuda a simplificar el manejo de la información.
  • Diferenciar entre datos crudos y limpios: Mantén los datos originales intactos dentro de una carpeta RAW. Posteriormente, limpia estos datos y preséntalos en otro notebook, sin desperdiciar los pasos originales que llevaron al dataset final.
  • Un repositorio limpio: Un repositorio bien organizado no solo facilita tu trabajo sino que mejora la comunicación con otros profesionales que puedan colaborar contigo en el futuro.

¿Cómo perfeccionar la comunicación de datos?

Una vez que tienes tu modelo y repositorio en orden, el siguiente paso es comunicar sus resultados adecuadamente. Aquí entran en juego no solo las habilidades técnicas, sino también las soft skills, que pueden ayudarte a elegir el público correcto y el medio más efectivo para transmitir tus resultados.

¿En qué mejorar nuestra entrega personal?

  • Claridad y simplicidad: Es esencial que los reportes sean claros e intuitivos para todos los stakeholders involucrados.
  • Visualizaciones efectivas: Invertir tiempo en crear visualizaciones puede ayudarte a transmitir de una manera más impactante los hallazgos del proyecto.
  • Educación continua: Considera cursos especializados que se ofrezcan en tu área de data science, visualizaciones o entorno avanzado para seguir refinando tus habilidades.

Recuerda que cada proyecto es una oportunidad para mejorar y crecer, así que no olvides revisar y perfeccionar cada aspecto del mismo. Así, podrás contribuir significativamente tanto a tu desarrollo personal como al avance del proyecto en el que trabajas. ¡Manos a la obra y sigue adelante!

Aportes 5

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Para comunicar los datos tenemos que elegir a nuestro público. Tenemos que elegir el medio que nuestro público va a preferir.
Para esto nuestro repositorio debe estar optimizado (Git y GitHub).
El poder versionar un proyecto es muy útil: se puede trabajar en forma colaborativa, guardar lo hecho y evitar pisar lo que sirve.
Es recomendable seguir un buen estándar para organizar los proyectos en nuestro repositorio. Referencia: cookiecutter data science.
No perder lo que ya intentamos hacer y lo que funcionó (como fué la metodología) . Dir: raw/notebooks originales.
Elige tu entregable personal

no reproduce el video… ayuda! gracias.

Cookiecutter data science es un gran aporte! Acabo de descubrirlo en esta clase y lo aplicare en todoso mis proyectos

a mi me toco batallar tambien, me fui a historial y seleccionar

Muy buenos consejos en esta clase 🥇