¿Por qué se utiliza el promedio de las variables y no simplemente se minimiza la sumatoria del error (y_observado

Daniel Montes

Pregunta

student•

¿Por qué se utiliza el promedio de las variables y no simplemente se minimiza la sumatoria del error (y_observado - y_modelo)^2?

Jhon Alexander Cardenas

student•

Hola Daniel, La formula que el profesor hace no te srive directamente para desarrollar el modelo lineal, lo que hace es calcular la suma de los errores en la media.

Hay tres tipos de sumatorio: los errores totales, suma de los cuadrorados explicados suma de los error del termino de error.

Si quieres calcular el modelo lineal por Mco debes calcular la b1 del modelo lineal con la siguete formula. Esa escrito de manera matricial.-1 es la inversa b = (X'X)-1X'Y

Estos apuntes pueden ayudarte a entender sobr la regression lineal. No se que tan importante puede llegar a ser en ML pero en econometria es de lo mas importante https://ocw.unican.es/pluginfile.php/1127/course/section/1352/Ppt_Ch3_G942_14-15.pdf

Espero que te haya sido de ayuda Saludos

Iván Álvarez Romero

student•

De hecho sí se minimiza la sumatoria del error (y_observado - y_modelo)^2 y del procedimiento se deducen las ecuaciones que vemos en el curso. Los promedios surgen de forma natural de la demostración.
Si quieres adentrarte en el tema aquí está la demostración, pero antes necesitas conocimientos básicos de cálculo diferencial y resolución de sistemas de ecuaciones lineales: https://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal#Estimaci%C3%B3n_de_los_par%C3%A1metros
Nota: En la demostración dan por hecho que y_modelo = b0 + b1x por lo que (y_observado - y_modelo)^2 = (y_observado - b0 - b1x)^2 así se obtiene la función de error cuadrático.

¿Por qué se utiliza el promedio de las variables y no simplemente se minimiza la sumatoria del error (y_observado - y_modelo)^2?

Curso Práctico de Regresión Lineal con Python

Curso Práctico de Regresión Lineal con Python