Qué es la validación cruzada en IA

Curso de Estadística Inferencial para Data Science e Inteligencia Artificial

Contenido del curso

No sé dónde empezar

Fundamentos de estadística inferencial

Estadísticos y cálculos

Pruebas de hipótesis y validación

Cierre del curso

22
Estadística inferencial aplicada al machine learning
01:28 min

Tomar examen

Qué es la validación cruzada en IA

Resumen

La validación cruzada es la técnica que aplicas al final de tu análisis para confirmar que tus datos de prueba son independientes de los datos de entrenamiento. Te sirve para validar modelos de machine learning con mayor confianza estadística y es clave si trabajas en proyectos de inteligencia artificial donde necesitas medir qué tan bien predice tu modelo.

Por qué dividir los datos en entrenamiento y prueba

Cuando trabajas en problemas de inteligencia artificial, divides la información en dos grupos con propósitos distintos. Uno se queda intacto y el otro se modifica con el modelo estadístico.

Grupo de entrenamiento: es el que vas alterando y ajustando con el modelo.
Grupo de prueba: se mantiene sin aplicarle ningún modelo estadístico, sirve como referencia.
Objetivo final: validar que tu predicción se ajusta al modelo de origen.

La lógica es simple: necesitas que un grupo ajuste al otro para comprobar que tu predicción tiene sentido fuera de los datos con los que la entrenaste.

¿Para qué sirve la validación cruzada? Sirve para demostrar que los datos de prueba son independientes de los datos de entrenamiento y que tu modelo predice bien sobre información nueva.

Cómo funciona la validación cruzada paso a paso

El procedimiento se basa en partir tu población en varios subgrupos del mismo tamaño y rotar cuál de ellos cumple el rol de validador. Aquí entra el concepto de k-fold.

Qué significa el valor k en k-fold cross validation

La k representa el número de divisiones aleatorias que haces sobre tus datos. Puedes elegir 10, 15, 20 o cualquier número que tenga sentido para tu volumen de información.

Divide la población total en k grupos aleatorios de tamaño similar.
Aparta uno de esos grupos: por eso se habla de k menos uno para entrenamiento.
Usa el grupo apartado para validar el modelo entrenado con los k-1 restantes.

Ese grupo separado es el que te confirma si lo que aprendió tu modelo funciona o no.

Por qué se repite el proceso varias veces

La idea de hacer cross validation es comparar validaciones, no quedarte con una sola medición. Por eso repites el procedimiento n veces o k veces.

En cada iteración cambias cuál subgrupo actúa como prueba. Vas de la iteración uno, a la dos, a la tres, hasta cubrir el total que definiste. Así evitas que un solo corte afortunado o desafortunado distorsione tu evaluación.

¿Cuántas veces debo repetir la validación cruzada? Tantas como subgrupos hayas creado. Si elegiste k=10, repites el proceso 10 veces rotando el subgrupo de prueba.

Qué buscas al final del proceso

El resultado ideal es que tu población de entrenamiento y la de prueba se ajusten lo máximo posible. Cuando eso ocurre, tienes evidencia de que el modelo generaliza bien.

Visualmente, el flujo va así: de la selección total de la población sacas una pequeña muestra de prueba, ejecutas la primera iteración, pasas a la segunda, a la tercera y continúas hasta el número total de iteraciones que definiste. Cada vuelta te da una métrica de validación que después comparas.

En la siguiente clase verás cómo automatizar este proceso en Python para no tener que rotar los subgrupos manualmente. ¿Ya pensaste con qué valor de k vas a empezar tus pruebas?

Juan José Mamani Tarqui

Estudiante

VALIDACION CRUZADA

Ver otras versiones

volume_up

La validación cruzada es una técnica estadística que se utiliza para evaluar el rendimiento de un modelo estadístico. La validación cruzada se basa en la partición de los datos disponibles en dos conjuntos: un conjunto de entrenamiento y un conjunto de prueba. El modelo se entrena en el conjunto de entrenamiento y se evalúa en el conjunto de prueba.

La validación cruzada se utiliza para evitar el sobreajuste, que es la situación en la que un modelo se ajusta demasiado a los datos de entrenamiento y no es capaz de generalizar bien a nuevos datos. La validación cruzada ayuda a garantizar que el modelo se ajuste a los datos de entrenamiento sin perder la capacidad de generalizar.

Existen diferentes tipos de validación cruzada, cada uno con sus propias ventajas y desventajas. Algunos de los tipos de validación cruzada más comunes son:

Validación cruzada simple: Los datos se dividen en dos conjuntos, un conjunto de entrenamiento y un conjunto de prueba. El modelo se entrena en el conjunto de entrenamiento y se evalúa en el conjunto de prueba.
Validación cruzada k-ple: Los datos se dividen en k conjuntos, cada uno de los cuales se utiliza como conjunto de prueba una vez. El modelo se entrena en los k-1 conjuntos restantes. La media de las puntuaciones de los conjuntos de prueba se utiliza para evaluar el rendimiento del modelo.
Validación cruzada por holdout: Los datos se dividen en dos conjuntos, un conjunto de entrenamiento y un conjunto de prueba. El conjunto de prueba se mantiene reservado hasta el final del proceso de entrenamiento. El modelo se entrena en el conjunto de entrenamiento y luego se evalúa en el conjunto de prueba.

Ventajas de la validación cruzada

La validación cruzada ofrece varias ventajas sobre otros métodos de evaluación del rendimiento de los modelos estadísticos, como:

Reduce el riesgo de sobreajuste: La validación cruzada ayuda a garantizar que el modelo se ajuste a los datos de entrenamiento sin perder la capacidad de generalizar.
Es más precisa: La validación cruzada utiliza todos los datos disponibles para evaluar el rendimiento del modelo.
Es más flexible: La validación cruzada se puede utilizar con cualquier tipo de modelo estadístico.

Desventajas de la validación cruzada

La validación cruzada también tiene algunas desventajas, como:

Requiere más datos: La validación cruzada requiere que los datos se dividan en dos conjuntos, lo que significa que se utiliza menos datos para entrenar el modelo.
Es más compleja: La validación cruzada es un poco más compleja de implementar que otros métodos de evaluación del rendimiento de los modelos estadísticos.

En general, la validación cruzada es una técnica valiosa que se puede utilizar para evaluar el rendimiento de los modelos estadísticos. La validación cruzada ayuda a garantizar que los modelos se ajusten a los datos de entrenamiento sin perder la capacidad de generalizar.

Qué es la validación cruzada en IA

Fundamentos de estadística inferencial

Estadística inferencial vs descriptiva en IA

Componentes principales de la estadística

Qué es la distribución normal y sus ejemplos

Tipos de muestreo y teorema del límite central

Muestreo aleatorio y sistemático en Python

Muestreo estratificado con pandas en Python

Estadísticos y cálculos

Media muestral vs media poblacional

Varianza poblacional vs muestral en estadística

Varianza y desviación estándar en Python

Qué son los intervalos de confianza

Cómo calcular intervalos de confianza con tabla Z

Intervalos de confianza en Python con SciPy

Pruebas de hipótesis y validación

Qué son las pruebas de hipótesis

Student, Pearson o ANOVA: cuál usar

Errores tipo I y tipo II en hipótesis

Prueba t de Student con Python paso a paso

ANOVA y Pearson para validar hipótesis en Python

Qué es bootstrapping y cuándo usarlo

Bootstrapping en Python para calcular promedios