28

Comprende las Formulas de Probabilidad y Estadística

<h2>¿QUÉ ES ESTO?</h2>


Seee, probablemente no entiendas nada. Igual como me paso a mi. Pero descuida eso te lo soluciono con este tutorial de cómo leer Algoritmos(por lo menos los de este curso)

<h2>Importante</h2>

Sé muy bien que no a todos les gustan la matemáticas, pero vale la pena hacer un esfuerzo para entenderlas. No quiero decir que las matemáticas sean lo mas importante ni mucho menos. Pero la indisposición puede hacer que no continues con tu aprendizaje. Así que dale una oportunidad a esta lectura y te prometo que entenderás mejor cómo leer los algoritmos vistos en el curso.

<h2>Probabilidad y Estadística</h2>

Todo esto ocurre en las clases de Machine Learning cuando vemos probabilidad y estadística como también los algoritmos. Debo decir que la profesora se ahorro los problemas de explicar la formula dandonos los pasos lógicos para resolverla (Me parece una idea genial). Aun así nos queda el “clavo” de cómo se lee la formula.

Pues resulta, que como casi todo, es muchísimo mas fácil de lo que parece. Para entender la formula lo único que hay que hacer es poder leer y entender los conceptos.

<h2>“Σ” o Sumatoria</h2>

“Σ” se define como Sumatoria

Que significa?
Que cualquier lista de valores dentro de “Σ” se sumaran.

Como funciona?
Supongamos que la letra “K” tiene los 3 siguientes numeros = [1, 2, 3].

Ahora bien, “n” es igual a la cantidad de valores de K, en este caso es 3, porque K tiene 3 valores.

Todo bien hasta ahora, entonces, ¿cómo funciona?

Entendamos “Σ” como un ciclo, o en programacion como un ciclo for.
Este ciclo empezará por el primer valor de la lista de valores de “K”, que es 1, luego le sumara el segundo que es 2 y finalmente el último que es 3.

1 + 2 + 3 = 6

Asi que las Sumatoria de K es 6

Otro Ejemplo:

X = [13, 16, 18, 17]
Σ(x) = 13 + 16 + 18 + 17 = 64

<h2>La media o el promedio</h2>

Ahora bien, ya sabemos que es Σ dentro de la operacion. Pero ahora que significa ?

se lee como la media de una lista de valores. Eso quiere decir, que al igual que “Σ”, requiere de una lista de valores para calcular la media.

Ejemplo:

X = [13, 16, 18, 17]

Ok, sabemos que X tiene 4 valores. Pero ahora qué?

La formula indica que es la sumatoria de X dividido entre “n”. Si recordamos, “n” es la cantidad de valores de una lista de valores.

Entonces:

= Σ(x) / n

Donde la sumatoria de X es 64
Σ(x) = 13 + 16 + 18 + 17 = 64

Y la cantidad de valores es 4

Finalmente podemos dividir 64 entre 4.

64 / 4 = 16

Por lo que podemos decir que es igual a 16; o en español decimos que el promedio de los valores [13, 16, 18, 17] es 16.

<h2>Regresión Lineal</h2>

He aqui el reto mas dificil! La regresion lineal.

Espera!!! Verás que es super sencillo.

Esta es la Formula:

Ahora bien, Cómo lo resuelvo?

Primero por partes, qué es lo que se quiere lograr?

Supongamos que nos dedicaremos a vender frutas en la calle, mas precisamente manzanas. Durante 5 días hemos estado vendiendo manzanas, pero queremos suponer cuanto podríamos ganar mañana. Para eso usaremos esta formula, para especular el siguiente valor dentro de una lista de valores.

Entonces, por donde empiezo?

Lo primero es identificar los datos. Donde “X” es la lista con los valores obtenidos (La venta de manzanas) y donde “t” es el orden lógico en la que se obtuvieron los valores (los días).

X = [20, 25, 22, 28, 30] (Ventas de manzana)
t = [1, 2, 3, 4, 5] (Dias)

Ok, pero que es X con ^ arriba y que es la t?

X con ^ representa la regresión lineal, una predicción. Y “t” significa el valor a futuro en el cual se estimará.

Ahora bien, que es “a” y que es “b”

Como podemos ver, para poder tener “a” debemos tener “b” (La formula de a incluye b).

Asi que resolvamos b:

Dice que
"b" = n * Σ(x * t) - Σ(x) * Σ(t) / n * Σ(t^2) - [Σ(t)]^2

Se ve feo verdad?
Tranquilo, vamos por partes.

Remplacemos n por el valor que tenemos

n = 5 (cantidad de valores en X y t)
“b” = 5 * Σ(x * t) - Σ(x) * Σ(t) / 5 * Σ(t^2) - [Σ(t)]^2

Ahora resolvamos las Sumatorias

X = [20, 25, 22, 28, 30] (Ventas de manzana)
t = [1, 2, 3, 4, 5] (Días)

Σ(x * t) = (20 * 1) + (25 * 2) + (22 * 3) + (28 * 4) + (30 * 5) = 20 + 50 + 66 + 112 + 150 = 398
Σ(x) = 20 + 25 + 22 + 28 + 30 = 125
Σ(t) = 1 + 2 + 3 + 4 + 5 = 15
Σ(t^2) = 1^2 + 2^2 + 3^2 + 4^2 + 5^2 = 1 + 4 + 9 + 16 + 25 = 55
[Σ(t)]^2 = 15^2 = 225

Ahora bien, Sustituimos

“b” = [5 * 398 - 125 * 15] / [5 * 55 - 225] = 115 / 50 = 2.3

Listo, con esto tenemos la pendiente y aun mas importante, podimos leer y sustituir la formula problematica.

Viste, pan comido!

Ahora vamos a terminar

La media de X es = 25
La media de t es = 3

Remplazamos:

a = 25 - 2.3 * 3 = 18.1

Finalmente

La predicción al día 6 es = 18.1 + 2.3*6 = 31.9

Así que la predicción hecha con el algoritmo de regresión lineal me indica que mañana venderé 31.9 manzanas 😄

Sigue aprendiendo!

Escribe tu comentario
+ 2