Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Desarrollo de pipeline de reentrenamiento: validación del modelo

13/24
Recursos

Aportes 2

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Ya lo logre para AWS. La forma en que lo explica el profe me parece la mas directa, ya que guardas los datos directamente en el bucket.

pip install dvc
pip install dvs[s3]
dvc init

aqui puedes crear un commit para especificar que iniciaste el versionado con dvc.

git add .
git commit -m " Initialize DVC"
git push

procede a agregar tus datos y modelos a versionar,++ voy a usar una ruta diferente al del profe++

dvc add data/tus_datos.csv
dvc add modelos/tu_modelo.pkl

aqui podemos hacer otro commit para especificar que cramos los .dvc

git add .
git commit -m " add data.csv and model.dvc"
git push

Este comando crea una sección remote en el archivo de configuración del proyecto DVC y opcionalmente, asigna un control remoto predeterminado en la sección central a myremote.

dvc remote add -d remote s3://dvcbucket/folder

necesitamo las llaves id y secret para acceder a aws desde nuestra pc y las usamos asi.

dvc remote modify myremote access_key_id AWS_ACCESS_KEY_ID
dvc remote modify myremote secret_access_key AWS_SECRET_ACCESS_KEY

en .dvc/config encontraras los parametro de configuracion del bucket

[core]
      remote = myremote
['remote "myremote"']
      url = s3://dvcexample/ner
      access_key_id = AWS_ACCESS_KEY_ID
      secret_access_key = AWS_SECRET_ACCESS_KEY

despues de tener configurado el bucket solo hacemos

dvc push

no olviden eliminar sus llaves andes de hacer un git push,
por ultimo

git add . 
git commit -m "version data and model done"
git push