Etiquetado de los datos de test

Curso Profesional de Computer Vision con TensorFlow

Contenido del curso

Comprender la visión computarizada

Dimensionamiento de proyecto de visión computarizada

Obtención y procesamiento de los datos

Entrena, testea y optimiza tus modelos

Producto con visión computarizada en producción

Siguientes pasos en inteligencia artificial

Tomar examen

Etiquetado de los datos de test

Mario Alexander Vargas Celis

Estudiante

El etiquetado de los datos de test es esencial para evaluar correctamente el rendimiento de un modelo de machine learning, ya que permite comparar las predicciones del modelo con las etiquetas reales. Aquí tienes algunas recomendaciones para etiquetar tus datos de test:

### 1. **Crear un sistema de etiquetado consistente**

- Si trabajas con datos de imágenes, asegúrate de usar un sistema de nombres o etiquetas consistente. Por ejemplo, puedes almacenar las etiquetas en un archivo CSV o en un formato JSON, con una estructura como:

- imagen\_001.jpg, etiqueta

- imagen\_002.jpg, etiqueta

Ejemplo en CSV:

```csv

filename, label

imagen_001.jpg, perro

imagen_002.jpg, gato

```

Ejemplo en JSON:

```json

{

"imagen_001.jpg": "perro",

"imagen_002.jpg": "gato"

}

```

### 2. **Herramientas para etiquetar datos visuales**

- Existen herramientas que facilitan el etiquetado, especialmente en proyectos de visión computarizada:

- **LabelImg**: Herramienta gratuita para etiquetar imágenes con cuadros delimitadores (bounding boxes), útil para tareas de detección de objetos.

- **Labelbox**, **SuperAnnotate** y **VGG Image Annotator (VIA)**: Son herramientas versátiles que permiten trabajar con diferentes tipos de etiquetas, incluyendo segmentación y clasificación.

### 3. **Automatizar el etiquetado cuando sea posible**

- Para grandes cantidades de datos, el etiquetado manual puede ser ineficiente. Una estrategia común es usar un modelo preentrenado para etiquetar automáticamente los datos y luego realizar una revisión manual.

- Puedes usar modelos de visión computarizada preentrenados en bibliotecas como **TensorFlow**, **PyTorch** o **Hugging Face**, y después hacer un ajuste fino.

### 4. **Validación de etiquetas**

- Asegúrate de que el conjunto de test esté etiquetado con precisión para evitar un sesgo en la evaluación del modelo. Esto puede requerir una revisión manual o una validación cruzada de las etiquetas.

### 5. **Ejemplo de lectura de etiquetas en Python**

Si ya tienes un archivo CSV con las etiquetas, aquí tienes un código para cargarlo usando pandas:

```python

import pandas as pd

# Leer archivo CSV con etiquetas

etiquetas = pd.read_csv('test_labels.csv')

# Acceder a una etiqueta específica

etiqueta_imagen = etiquetas.loc[etiquetas['filename'] == 'imagen_001.jpg', 'label'].values[0]

print(f"La etiqueta de imagen_001.jpg es: {etiqueta_imagen}")

```

### 6. **Estructura de carpetas para etiquetas de test**

- Si tu sistema de archivos permite organizar imágenes de test por categoría, podrías crear subcarpetas dentro de la carpeta de test para cada etiqueta. Por ejemplo:

```

test/

├── perro/

│ ├── imagen_001.jpg

│ ├── imagen_003.jpg

└── gato/

├── imagen_002.jpg

├── imagen_004.jpg

```

Organizar y etiquetar correctamente el conjunto de test es fundamental para realizar evaluaciones precisas y garantizar que el modelo se comporte bien en datos no vistos.

Nicolas Erices Mendez

richard nina

Raul Perez-Alejo Neyra

Camilo Jose Bolaños Villarroel

Jose Luis Resendiz Gutierrez

Luis Rogelio Reyes Hernandez

Anthony Ismael Manotoa Moreno

Angel David Sasso Villa

Adonai Vera

Profesor

Eber Laurente Lliuyacc

ivan josue ortiz alban

Victor Benjamin Ghiggo de la Cruz

Edwin Cristian

Máximo Fernández Núñez

Jhon Freddy Tavera Blandon

Etiquetado de los datos de test

Comprender la visión computarizada

¿Por qué aprender computer vision?

¿Qué es la visión computarizada?

Tipos de visión computarizada

Introducción a object detection: clasificación + localización

Aprende a identificar problemas

Dimensionamiento de proyecto de visión computarizada

Cómo definir los tiempos de tu proyecto

Cómo costear tu proyecto

Cómo identificar los roles necesarios en el proyecto

Producto mínimo viable en computer vision

Obtención y procesamiento de los datos

Obtención de datos para tu proyecto

Limpieza de la base de datos

Distribución de datos en entrenamiento y testeo