Carga de dataset para computer vision
Clase 8 de 17 • Curso de Transfer Learning con Hugging Face
Contenido del curso
Clase 8 de 17 • Curso de Transfer Learning con Hugging Face
Contenido del curso
Fredy Alberto Orozco Loaiza
Omar Uriel Espejel Díaz
Patricio Sánchez Fernández
Miguel Rodríguez
JUAN DAVID ORTIZ CORREA
Jose Colmenares
Gilberto Espinoza Maciel
Erledie Salazar
Matias Cardozo
Maria Barrera
Fredy Alberto Orozco Loaiza
cristhian toribio amaro
Edwin F Bohorquez Vargas
Patricio Sánchez Fernández
Camilo Daza
Anderson Chávez Tamayo
wilmer ruiz
Simón Arboleda
Víctor Trigo
Kevin Daniel Mora Gonzalez
Luis Espinoza Balcazar
Víctor Trigo
MARIA TERESA PANIAGUA RIVERA
Emilio Sala
Gabriel Jaime Cardona Osorio
Creo que está mal llamar a lo que hicimos extracción de características. En la literatura se conoce como extracción de características, a los valores de la penultima capa de la red (Antes de entrar a la clasificación). Las aplicaciones de esto es para transformar imagenes (Que son datos no-estructurados) a datos estructurados ya aplicar modelos clásicos con ellos. Lo que hicimos aquí más bien lo llamaría pre-procesamiento y son transformaciones que le hacemos a la imagen para entrarlas al modelo.
Me hace sentido lo que mencionas. Concuerdo. Como está ahora "extracción de características" es como se le conoce en los transformers.
Fredy, gracias por compartir tus conocimientos...!
repo_id = 'google/vit-base-patch16-224-in21k'
Actualmente el ViTFeatureExtractor esta deprecado, sugiere usar ViTImageProcessor
A mi me funcionó el código del notebook de Colab sin problemas
Siguiendo el ejemplo de la clase me aparecio la siguiente advertencia
FutureWarning: The class ViTFeatureExtractor is deprecated and will be removed in version 5 of Transformers. Please use ViTImageProcessor instead.f
Entonces el bloque a ejecutar es el siguiente en este paso
from transformers import ViTImageProcessor repo_id = 'google/vit-base-patch16-224-in21k' feature_extractor = ViTImageProcessor.from_pretrained(repo_id)
Con eso podemos seguir con el resto del tutorial
Genial, gracias por el dato.
El feature extractor que se utilizó tiene que reunir las mismas caracteristicas que el modelo preentrenado? Es decir si el imput del modelo por ej. asumamos que necesita 224x224, el feature extractor tiene que ser capaz tambien de transformar las nuevas imagenes a 224x224? No entiendo mucho su aplicación.
Gracias!
Creo que síp, pero el feature extractor no estoy muy segura si se encarga de hacer el mismo procesamiento, yo lo veo más como informativo sobre el procesamiento. Ya uno se debe de encargar de hacer ese mismo procesamiento con el dataset de uno!!
Si exactamente, más que un extracción de caracterisisticas es una trasnformación de la imagen para que pueda entrar al modelo. Es más si pones esté código, ves la imagen original, algo cambiada.
from matplotlib import pyplot as plt plt.imshow(image[0].numpy().transpose(1,2,0))
hola cotnrate google colab pro, configurado con GPU y estandar, y quiero ejecutar: from transformers import TrainingArguments
training_args = TrainingArguments( output_dir="./platzi-vit-model-omar-espejel", evaluation_strategy="steps", num_train_epochs=4, push_to_hub_organization="platzi", learning_rate=2e-4, remove_unused_columns=False, push_to_hub=True, load_best_model_at_end=True, )
me da error, me puedes ayudar?
para poder hacer entrenamiento de nuestro modelo requerimos: un modelos, argumentos de entrenamiento, una función colab, datos de entrenamiento, datos de la función, datos de validación, función de features
Excelente apunte, gracias Edwin...!
Hola, si estoy usando otro dataset, y al momento de ejecutar el feature extractor, me aparece este mensaje, como lo puedo solucionar, me sucede de hecho con varios datasets diferentes en HF:
ValueError: Unsupported number of image dimensions: 2
y este es el codigo, igual al de la clase:
feature(image1,return_tensors=“pt”)
Ayuda?
Hola! Cuando coloco el símbolo ! se pone de color rojo como si fuera de error, alguien sabe por qué pasa eso?
Hola, esttaba haciendo el ejercicio y no me salio, pero dio ese error he intentado con algunas cosas de stackoverflow pero no me resulto en google colab ¿que es?
from datasets import load_dataset ds = load_dataset("beans") ModuleNotFoundError Traceback (most recent call last) <ipython-input-2-5a886ec9890a> in <cell line: 1>() ----> 1 from datasets import load_dataset 2 3 ds = load_dataset("beans") ModuleNotFoundError: No module named 'datasets'
como puedo usar el feature extractor para que me retorne tensores de numpy?
¿Cómo sé cuál es la id de un modelo o repo?
lambdalabs/pokemon-blip-captions Copied al inicio de la card del modelo te da un nombre asi en vez de Copied esta un icono de copiar
que significa el 3 en el shape del feature_extractor?
Creo que son los 3 canales RGB de la imagen
Gracia
Para más información: Documentacion VITImageProcessor
En estos momentos, al momento de usar:
labels = ds['train'].features['labels']
Genera el siguiente error: KeyError: 'labels'
Por lo que solo basta con escribir:
labels = ds['train'].features['label'] labels
Para obtener el mismo output de la clase