
Leonardo David Alonso Sosa
PreguntaAlguien puede aclararme la razón de elevar al cuadrado el error, es decir entiendo que el cuadrado va a hacer mas grande un error pequeño y enorme un error grande, pero cual es la motivación para hacer eso? Supongo que es para trabajar solo con errores positivos entendiendo que un error negativo representaría que nuestra predicción redefinió la expectativa de alguna manera

Alfonso Morán
No, que se hagan más grandes o pequeños los errores son una consecuencia de elevar al cuadrado, lo cual nos ayuda penalizar más o menos los errores, pero no elevamos al cuadrado por eso. ¿Por qué mejor no elevar a 3, 4 , 5 o cualquier otro número? Seguiríamos penalizando los errores grandes y los pequeños serían más pequeños.
¿Qué implica elevar al cuadrado?¿Qué función es esta?
f(x) = (y_calculada-y_experimental)^2
Esta es una función cuadrática y nosotros ya sabemos como es la figura:
Normalmente buscamos ajustar una curva, o en este caso una línea recta a la que llamamos función de coste, que busque predecir nuestros puntos experimentales. Para hacer que la curva pase lo más cerca de nuestros puntos necesitamos manipular nuestros parámetros, en este caso para una línea recta son la pendiente y el bias.
¿Qué parámetros debemos escoger para que nuestra modelo o función de coste prediga con buena precisión nuestros datos? Fácil. Aquellos parámetros que minimicen el error, y nuestra función de error es una parábola, porque es cuadrática, eso quiere decir que tenemos un mínimo. Esto es la técnica de Mínimos Cuadrados, una optimización de parámetros para ajustar una curva a datos.

Leonardo David Alonso Sosa
Tienes razón Alejo, jamás considere el cuadrado de valores muy pequeños, gracias por la aclaración

Kevin Alejandro Tovar Lamilla
Hola Leo, tienes razón ese eleva al cuadrado para evitar valores negativos pero ten en cuenta que elevar al cuadrado no solo hará un numero más grande, si el error es muy pequeño (menos a 1) este será mas pequeño aun al elevarlo, y entre más crezca el número, mayor será su resultado al elevarlo al cuadrado, con esto se logra que el programa vea como algo insignificante los errores muy pequeños y que halla un "castigo" mayor entre más alto sea el error, por ejemplo, error 1 = 2 y error 2 = 4, el "castigo" del segundo error no será del doble del 1, en el primero tomara 4 como error y en el error 2 tomara 16 como nuevo valor, así, es muchísimo peor equivocarse en 4 unidades que en 2.