
Daniel Montes
Pregunta¿Por qué se utiliza el promedio de las variables y no simplemente se minimiza la sumatoria del error (y_observado - y_modelo)^2?

Iván Álvarez Romero
De hecho sí se minimiza la sumatoria del error (y_observado - y_modelo)^2 y del procedimiento se deducen las ecuaciones que vemos en el curso. Los promedios surgen de forma natural de la demostración.
Si quieres adentrarte en el tema aquí está la demostración, pero antes necesitas conocimientos básicos de cálculo diferencial y resolución de sistemas de ecuaciones lineales:
https://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal#Estimaci%C3%B3n_de_los_par%C3%A1metros
Nota: En la demostración dan por hecho que
y_modelo = b0 + b1x
por lo que
(y_observado - y_modelo)^2 = (y_observado - b0 - b1x)^2
así se obtiene la función de error cuadrático.

Jhon Alexander Cardenas
Hola Daniel, La formula que el profesor hace no te srive directamente para desarrollar el modelo lineal, lo que hace es calcular la suma de los errores en la media.
Hay tres tipos de sumatorio: los errores totales, suma de los cuadrorados explicados suma de los error del termino de error.
Si quieres calcular el modelo lineal por Mco debes calcular la b1 del modelo lineal con la siguete formula. Esa escrito de manera matricial.-1 es la inversa b = (X'X)-1X'Y
Estos apuntes pueden ayudarte a entender sobr la regression lineal. No se que tan importante puede llegar a ser en ML pero en econometria es de lo mas importante https://ocw.unican.es/pluginfile.php/1127/course/section/1352/Ppt_Ch3_G942_14-15.pdf
Espero que te haya sido de ayuda Saludos