No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

¿Qué es DVC y por que lo utilizaremos?

8/24
Recursos

Aportes 5

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

o inicia sesión.

Herramientas para ML Data Versioning:
● Neptune
● Pachyderm
● Delta Lake
● Git LFS
● DoIt
● lakeFS
● DVC
● ML-Metadat

En resumen

En muchos proyectos tenemos un modelo.py (con el codigo python  del modelo) y un archivo modelo.pkl con el modelo empaquetado. git queda tiene problemas al tratar con archivos pesados como el .pkl así que DVC simplemente crea un archivo que referencia al modelo (model.pkl.dvc), el cual no pesa prácticamente nada.
Entonces versionaremos este model.pkl.dvc y train.py en git, mientras dvc se encarga de versionar el model.pkl (que pesa 500mb!) guardándolo en un almacenamiento de la nube. Lo mismo podríamos hacer con datasets. 

link de referencia

No es mucho, pero creo que esta clase debería estar antes que la anterior!

como trackeo mis modelos? como todo un payaso =D por eso estamos aqui aprobechando el platzi day!

He usado Git LFS, ya que una vez requeri subir unos .csv que pesaban casi 100MB