Análisis de resultados del modelo de regresión

Clase 27 de 29 • Curso de Fundamentos de Redes Neuronales con Python y Keras

Contenido del curso

Fundamentos en la arquitectura de redes neuronales

Redes neuronales con Python

Manejo de redes neuronales con Keras

Cierre

Tomar examen

Resumen

¿Cómo analizar los resultados de una red neuronal?

En este script, se aborda el proceso de análisis de resultados de una red neuronal, ajustando parámetros para mejorar su rendimiento. El enfoque principal es determinar el error cuadrático medio (MSE) y el error absoluto medio (MAE) a través de la iteración en diferentes épocas. Aquí te explicamos paso a paso cómo realizar este análisis y ajustar las variables necesarias para optimizar la red.

¿Qué pasos seguir para calcular el promedio de errores?

Primero, es crucial calcular el promedio de los errores generados en múltiples iteraciones de la red neuronal. Para implementarlo:

import pandas as pd

all_min_square_error = pd.DataFrame(all_history).mean(axis=0)

Esto generará un promedio de los errores a lo largo de las cuatro iteraciones en 80 épocas destacadas en el proceso inicial.

¿Qué podemos hacer si nuestras épocas son bajas?

Es posible que 80 épocas no sean suficientes para una regresión óptima. En tal caso, podríamos incrementar la cantidad a 500 épocas para analizar la diferencia:

epochs = 500
model.fit(training_data, training_labels, epochs=epochs)

Esto maximiza el potencial de aprendizaje del modelo, aunque a costa de un tiempo de computación más extenso.

¿Cómo visualizar el rendimiento del modelo?

El uso de visualizaciones es una herramienta esencial para entender el comportamiento del modelo a lo largo del entrenamiento. Aquí es donde entra en juego la librería matplotlib:

import matplotlib.pyplot as plt

plt.plot(range(1, len(all_mae_history)+1), all_mae_history)
plt.xlabel('Épocas')
plt.ylabel('Error Absoluto Medio')
plt.show()

Estas gráficas son necesarias para identificar cuándo el modelo comienza a caer en overfitting (cuando el modelo empieza a aprender demasiado bien del conjunto de entrenamiento, perdiendo precisión en nuevos datos).

¿Cuáles son las mejores prácticas para evitar errores comunes?

Escalar y normalizar datos: Garantiza que todas las características estén en el mismo rango y evita que las características de distinto orden de magnitud afecten el modelo desproporcionadamente.
Utilizar validación cruzada: Mejor conocido como "cross-validation", este método ayuda a asegurar que los resultados sean consistentes, permitiendo que el modelo tenga un mejor rendimiento en conjuntos de datos nuevos.
Métrica de éxito: Implementar el error absoluto medio (MAE) para evaluar constantemente la eficacia del modelo.
Función de pérdida: Para minimizar el error, el error cuadrático medio (MSE) es fundamental en la función de pérdida del modelo.

¿Cómo interpretar los resultados de la gráfica del error?

La interpretación de la gráfica de error es crucial. En las primeras iteraciones, el error podría disminuir drásticamente, pero después de un punto particular (antes de la iteración 100 en este ejemplo), más iteraciones pueden ocasionar un aumento en el error por overfitting. Así que, ajustar el número de épocas puede ser crítico para optimizar el aprendizaje del modelo:

optimal_epochs = 85
model.fit(training_data, training_labels, epochs=optimal_epochs)

Finalmente, el análisis eficiente y visualización de los resultados en redes neuronales no solo facilita la interpretación de sus resultados, sino que también es una herramienta clave para ajustar los hiperparámetros del modelo de manera efectiva, evitándose el overfitting. Continúa practicando, consulta la comunidad para compartir éxitos y enfrenta el desafío de mejorar el MAE lo más posible. ¡Mucho éxito en tu aprendizaje continuo de machine learning!

Comentarios

FELIX DAVID CORDOVA GARCIA

student•

Holis, les presento otra forma de hacer el problema ya que la del profe me terminó mareando :( (honestamente), en esta forma se usa cross validation de scikit learn.

Primero se importa KerasRegressor y cross_validate. Después se crea un función donde se colocan todas las capas de nuestra red neuronal, luego se convierten en DataFrame los datos dados al inicio del problema y se juntan los datas y los labels para solo tener un solo paquete de X & y con el cual hacer el cross_validate.

Posteriormente se realiza la normalización, pero en lugar de hacerlo calculado la media y la desviación estandar se importa el StandarScaler, con esto se obtiene los X & y normalizados ( previamente se les vuelve a convertir de DataFrame ya que al normalizarlos se transforman en arrays) . Despues se utiliza la funcion KerasRegressor para colocar la funcion que se ha creado ademas de las epocas y el tamaño de batch. Por ultimo se llama a la funcion cross_validate

A los resultados obtenidos (cross) se lo convierte a un DataFrame y se le toman un promedio para que sean mas faciles de interpretar los datos, en estos se observan que tanto el score de entrenamiento como el score de pruebas son muy altos además de que el loss y el mae son mucho menores que los calculados en clase lo cual demuestra la eficiencia de nuestra red

Sergio Alonso Gutierrez Sanchez

student•

Muy buena informacion!!. Me parece que hay un pequeño error en el escalamiento. Cuando se realize se debe omitir el set de prueba. Ya que estarías incluyendo información que supuestamente no tienes y tu info estaría sesgada. Sugiero hacer el escalamiento primero a tu x_train y y_train, transformas tambien el x_test y y_test y luego recien concatenas.

Daniel de Jesús Martínez Vega

student•

hay alguna forma de ver la evolución de la perdida a través de las épocas con cross_validate? Yo usé KFold para generar los grupos y con un for entrené los modelos para poder ver la evloución de la perdida en el grupo de validación

from sklearn.model_selection import KFold


kf = KFold(n_splits=5, shuffle=True)
validation_mae=np.zeros((5, 200))
counter=0
for train, val in kf.split(train_data):
    model = build_model_regression()

    validation_mae[counter] = model.fit(train_data[train], train_targets[train], epochs=200, batch_size =16, 
                        validation_data = (train_data[val], train_targets[val]),
                        verbose=0).history['val_mae']
    counter += 1

Alfonso Morán

student•

Cambié la arquitectura de la red y 80 epochs:

def build_model_regression(input_data):
    model = models.Sequential()
    model.add(layers.Dense(50,activation='relu',input_shape=(input_data,)))
    model.add(layers.Dropout(0.5))
    model.add(layers.Dense(50,activation='relu'))
    model.add(layers.Dropout(0.5))
    model.add(layers.Dense(1))
    model.compile(optimizer='rmsprop', loss='mse',metrics=['mae'])
    return model

loss: 19.8648 - mae: 3.1667

Angel Afonso

student•

Agregué regularización L2 en las primeras dos capas pasandole 0.0001 de parametro y cambié a 104 epochs

Juan R. Vergara M.

student•

Genial 🥇

Damian Nerox Contreras Orellana

student•

Aumente el doble la primera capa

Model: "sequential"
_____________________________________________
Layer (type)                 Output Shape              Param #   
===========================================
dense (Dense)                (None, 128)               1792      
_____________________________________________
dense_1 (Dense)              (None, 64)                8256      
_____________________________________________
dense_2 (Dense)              (None, 1)                 65        
===========================================
Total params: 10,113

Asigne a k que fuera 5, le di 70 epochs y un learning rate de 5e-4 osea 0.0005 con eso consegui un el siguiente loss y mae al evaluar

4/4 [==============================] - 0s 1ms/step - loss: 12.2931 - mae: 2.3541
[12.293133735656738, 2.3540897369384766]

probe con dropouts y al parecer aumentaban el mae, mientras que yo lo que buscaba era disminuirlo, fui probando learning rates y el 0.001 afectaba mucho mientras que el 0.0001 lo dejaba muy alto, asi que termino medio quedo justo

Jhon Freddy Tavera Blandon

student•

Métricas de Evaluación:

Calcula métricas de evaluación como el Error Absoluto Medio (MAE), el Error Cuadrático Medio (MSE) y el Coeficiente de Determinación (R²). Estas métricas proporcionan una medida cuantitativa del rendimiento del modelo.

from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

mae = mean_absolute_error(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'MAE: {mae}')
print(f'MSE: {mse}')
print(f'R²: {r2}')

Geovanny Garcia

student•

Tengo pensado en hacer un modelo de regresion para predecir el precio del bitcoin o cualquier stock, se ve sin duda una aplicacion que te podria dar mucho dinero

Diego Alejandro Lesmes

student•

Tal vez este repo te interese

Cesar Augusto Morales Godoy

student•

Modelo con menos perdida, lo hice agregando otra capa con 64 neuronas, los métodos de dropout y regularization no mejoraron su rendimiento.

mean absolute error

4/4 [==============================] - 0s 3ms/step - loss: 18.5582 - mae: 2.5696
[18.5582275390625, 2.5696332454681396]

LUIS ANTONIO CALVO QUISPE

student•

Una observación importante es que el RUIDO que se presenta es debido al tamaño del learning rate observemos que mientras mas pequeño, se reduce ...

Jhon Sanchez

student•

codigo para esos resultados?

Luis Enrique Sanchez Ramirez

student•

Tienes razón yo utilize (80 epochs , lr_var = 0.004 ) y mejoro en la evaluación [14.96.73, 2.5242710]

Jhon Valderrama

student•

Hola! En el for, cada vez que se corre estás creando y entrenando un modelo con diferentes datos (kfold validation), pero los modelos entrenados anteriores no se estan guardando, solo se guarda el "val_mae" como métrica en una lista.

¿Esta bien evaluar el los datos con el último modelo entrenado? pensaría que debería ser el mismo modelo pero que va mejorando en el con cada iteración, pero al parecer se entrena uno nuevo.

Es decir, ¿como garantizas que el último modelo que se entrenó es mejor por ejemplo que el primero?

Alarcon7a

student•

Hola, entiendo tu preocupación, efectivamente este metodo es mas para evaluar como es el desempeño respecto a la data de validación y cuantas epocas deberia iterar y con que parametros... una vez analize la grafica y vea los resultados puedo entrenar un modelo de cero con los parametros que consegui... todo esto sin necesidad de usar el kfold validation.

Jeison Gerardo Rodriguez

student•

Hay alguna forma de introducir seeds al trabajar con redes neuronales para reproducir código? Algo así como el random_state que tienen casi todos los algoritmos de machine learning.

SARA BURITICA MEJIA

student•

Hola a tod@s, no me quedó claro si la forma en que se entrena la red en este ejemplo es porque el ejercicio es de regresión o si solo era para ver otro método?

Alarcon7a

student•

Para este ejemplo por ser de regresión si, dado el caso que fuera clasificación cambia la función de costo y la ultima capa

rogelio cortez

student•

Hola comunidad les comparto mis resultados y como lo resolvi teniendo un MAE de 0.24721

Primero transforme a df la data

Posterior hice la normalizacion con la funcion StandarScaler

Posterior utilice las funcion de kerasRegressor

Por ultmo utilice la funcion de Kfold para hacer el entrenamiento y predicciones y obtener al final el promedio del MAE y R2.

Espero les sea de utilidad.

Noe Adrián Acuña Prado

student•

le cambié la arquitectura de la neurona usando la función de activación tanh

def build_model_regression(input_data):
    model = models.Sequential()
    model.add(layers.Dense(32,activation='tanh',input_shape=(input_data,)))
    model.add(layers.Dense(32,activation='tanh'))
    model.add(layers.Dense(1))
    model.compile(optimizer='rmsprop', loss='mse',metrics=['mae'])
    return model
```def build\_model\_regression(input\_data):    model = models.Sequential()    model.add(layers.Dense(32,activation='tanh',input\_shape=(input\_data,)))    model.add(layers.Dense(32,activation='tanh'))    model.add(layers.Dense(1))    model.compile(optimizer='rmsprop', loss='mse',metrics=\['mae'])    return model

Jhon Freddy Tavera Blandon

student•


4/4 ━━━━━━━━━━━━━━━━━━━━ 0s 8ms/step - loss: 14.2575 - mae: 2.5696 
[17.881376266479492, 2.76706862449646]

Selvin Medina

student•

Con 70 epocas

Carlos Eduardo Magallon Zepeda

student•

Mi resultado:

loss: 14.9894 - mae: 2.4928 [14.989350318908691, 2.492783784866333]

Con: 80 iteraciones

def build_model_regression(input_data):
    model = models.Sequential()
    model.add(layers.Dense(64,activation='relu',input_shape=(input_data,)))
    model.add(layers.Dense(48,activation='relu'))
    model.add(layers.Dense(32,activation='relu'))
    model.add(layers.Dense(1))
    model.compile(optimizer='rmsprop', loss='mse',metrics=['mae'])
    return model

Nicola Di Candia

student•

Hola a todos. Me encantaría saber si es posible obtener los datos predichos por el modelo para compararlos por medio de una grafica con los teóricos, o si solo puede observarse los errores? Saludos, gracias de antemano.

frank hurtado

student•

Hola alexandro, en la clase #17 en el minuto 6:50 hace la predicion, entonces podrias partir tu X y Y en 2 uno para training y otro para testing y asi poder hacer la grafica que deseas hacer

from sklearn.model_selection import KFold


kf = KFold(n_splits=5, shuffle=True)
validation_mae=np.zeros((5, 200))
counter=0
for train, val in kf.split(train_data):
    model = build_model_regression()

    validation_mae[counter] = model.fit(train_data[train], train_targets[train], epochs=200, batch_size =16, 
                        validation_data = (train_data[val], train_targets[val]),
                        verbose=0).history['val_mae']
    counter += 1

def build_model_regression(input_data):
    model = models.Sequential()
    model.add(layers.Dense(50,activation='relu',input_shape=(input_data,)))
    model.add(layers.Dropout(0.5))
    model.add(layers.Dense(50,activation='relu'))
    model.add(layers.Dropout(0.5))
    model.add(layers.Dense(1))
    model.compile(optimizer='rmsprop', loss='mse',metrics=['mae'])
    return model

Model: "sequential"
_____________________________________________
Layer (type)                 Output Shape              Param #   
===========================================
dense (Dense)                (None, 128)               1792      
_____________________________________________
dense_1 (Dense)              (None, 64)                8256      
_____________________________________________
dense_2 (Dense)              (None, 1)                 65        
===========================================
Total params: 10,113

from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

mae = mean_absolute_error(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'MAE: {mae}')
print(f'MSE: {mse}')
print(f'R²: {r2}')

def build_model_regression(input_data):
    model = models.Sequential()
    model.add(layers.Dense(32,activation='tanh',input_shape=(input_data,)))
    model.add(layers.Dense(32,activation='tanh'))
    model.add(layers.Dense(1))
    model.compile(optimizer='rmsprop', loss='mse',metrics=['mae'])
    return model
```def build\_model\_regression(input\_data):    model = models.Sequential()    model.add(layers.Dense(32,activation='tanh',input\_shape=(input\_data,)))    model.add(layers.Dense(32,activation='tanh'))    model.add(layers.Dense(1))    model.compile(optimizer='rmsprop', loss='mse',metrics=\['mae'])    return model

def build_model_regression(input_data):
    model = models.Sequential()
    model.add(layers.Dense(64,activation='relu',input_shape=(input_data,)))
    model.add(layers.Dense(48,activation='relu'))
    model.add(layers.Dense(32,activation='relu'))
    model.add(layers.Dense(1))
    model.compile(optimizer='rmsprop', loss='mse',metrics=['mae'])
    return model

Análisis de resultados del modelo de regresión

Fundamentos en la arquitectura de redes neuronales

La importancia de las redes neuronales en la actualidad

¿Que herramientas usaremos para redes neuronales?

¿Qué es deep learning?

Tu primera red neuronal con Keras

Entrenando el modelo de tu primera red neuronal

La neurona: una pequeña y poderosa herramienta

Arquitectura de una red neuronal

Funciones de activación

Funcion de pérdida (loss function)

Descenso del gradiente

Backpropagation

Playground - Tensorflow

Redes neuronales con Python

Dimensiones, tensores y reshape

Creando nuestra red neuronal usando numpy y matemáticas

Entrenamiento forward de la red neuronal

Aplicando backpropagation y descenso del gradiente

Entrenamiento y análisis de resultados de tu red neuronal

Manejo de redes neuronales con Keras

Data: train, validation, test

Resolviendo un problema de clasificacion binaria

Entrenamiento del modelo de clasificación binaria

Regularización - Dropout

Reduciendo el overfitting

Resolviendo un problema de clasificación múltiple

Entrenamiento del modelo de clasificación múltiple

Resolviendo un problema de regresión

Entrenamiento del modelo de regresión

Análisis de resultados del modelo de regresión

Cierre

¿Qué sigue por aprender de redes neuronales?

Comparte tu proyecto de tu primera red neuronal y certifícate