Contenido del curso

Introducción

1
Programación Dinámica y Estocástica: Optimización y Modelado de Datos
01:56 min

Programación Dinámica

Caminos Aleatorios

Programas Estocásticos

Simulaciones de Montecarlo

Muestreo e Intervalos de Confianza

Datos Experimentales

Conclusiones

24
Optimización de Programas con Programación Dinámica y Simulaciones
02:54 min

Tomar examen

Regresión Lineal con NumPy y Matplotlib en Google Colab

Resumen

Aproximar datos experimentales a una función matemática es una de las habilidades más valiosas en ciencia y programación. La regresión lineal permite encontrar la función que mejor se ajusta a un conjunto de datos obtenidos mediante experimentos, y hacerlo en Python resulta sorprendentemente sencillo gracias a herramientas como NumPy y Google Colab.

¿Qué es la regresión lineal y por qué no solo aplica a líneas rectas?

La regresión lineal es una técnica que aproxima un conjunto de datos experimentales a una función que queremos investigar [0:06]. Aunque su nombre sugiere que trabaja exclusivamente con líneas, en realidad permite aproximar cualquier función polinomial [0:26]. Una línea recta es simplemente un caso especial dentro de la familia de polinomios. Si añadimos términos como x², x³ o x⁴, seguimos dentro de esa misma familia.

Esto significa que con la misma técnica podemos modelar comportamientos más complejos, no solo relaciones directamente proporcionales.

¿Cómo usar Google Colab para ejecutar código con NumPy?

Para trabajar con librerías avanzadas de Python sin necesidad de instalar entornos como Anaconda, se utiliza Google Colab [1:02]. Esta plataforma en la nube ofrece acceso directo a librerías científicas y funciona mediante notebooks, que son una implementación de Jupyter Notebooks.

¿Cómo preparar los datos experimentales?

Dentro de un notebook en Colab, el primer paso es importar NumPy con la convención estándar:

python import numpy as np

Luego se declaran los datos experimentales como vectores usando np.array [1:50]:

python x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8]) y = np.array([1, 2, 3, 5, 4, 6, 8, 7, 9])

x representa la variable independiente: los valores que controlamos en el experimento.
y representa la variable dependiente: los resultados medidos.

Por ejemplo, cuando medimos 0 obtuvimos 1, cuando medimos 3 obtuvimos 5, y así sucesivamente.

¿Cómo obtener la función lineal con polyfit?

La función np.polyfit calcula los coeficientes de la recta que mejor se ajusta [2:46]:

python coeficientes = np.polyfit(x, y, 1) m = coeficientes[0] b = coeficientes[1] y_estimado = m * x + b

El tercer parámetro (el número 1) indica que buscamos un polinomio de grado uno, es decir, una línea recta con la forma clásica y = mx + b [3:10]. El valor de m es la pendiente y b es la ordenada al origen. En este ejemplo, m resulta aproximadamente 0.96.

¿Cómo visualizar la regresión lineal con matplotlib?

Para graficar los resultados se utiliza matplotlib, una librería científica de Python similar a bokeh pero con un enfoque más tradicional [4:06]:

python import matplotlib.pyplot as plt

plt.plot(x, y_estimado) plt.scatter(x, y) plt.show()

plt.plot dibuja la línea de regresión calculada.
plt.scatter muestra los puntos originales del experimento.
plt.show despliega el gráfico completo.

Al ejecutar este código, se observa que la línea se aproxima a los datos pero no todos los puntos caen exactamente sobre ella [4:36]. Esto es completamente normal en resultados experimentales: siempre existe una pequeña diferencia entre lo que predicen las matemáticas y lo que arroja la medición real. Esa diferencia puede medirse directamente con las técnicas de regresión lineal.

Si solo ejecutáramos el scatter sin el plot, veríamos únicamente los datos crudos sin la línea de ajuste [5:03].

La combinación de NumPy para el cálculo y matplotlib para la visualización demuestra que generar regresiones lineales en Python requiere apenas unas pocas líneas de código. Te invitamos a compartir en los comentarios qué otros conjuntos de datos crees que podrían ajustarse a una función lineal y que eventualmente podrías probar o descartar mediante un experimento.

Ronaldo Carbajal Tapahuasco

student•

Hola! Comparto un código que emula la regresión lineal ; dando la recta que mejor se acople a la nube de datos :D

def operacional_function():
    lista_xi=[]
    lista_yi=[]
    cantidad_de_xi = int(input("Hola, ingresa la cantidad de datos de la variable independiente: "))
    for i in range(cantidad_de_xi):
        xi=float(input("Ingrese el {}) valor de x: ".format(i+1)))
        lista_xi.append(xi)
        yi = float(input("Ingrese la {}) etiqueta:".format(i+1)))
        lista_yi.append(yi)
    sumax=contador(lista_xi)
    sumay=contador(lista_yi)
    mediax=promediador(sumax,len(lista_xi))
    mediay=promediador(sumay,len(lista_yi))
    productoxy=multiplicador(lista_xi,lista_yi)
    suma_cuadrados=cuadrado_de_sumas_x(lista_xi)
    
    n=len(lista_xi)
    
    
    pendiente = ((sumax*sumay)-(n*productoxy)) / (((sumax)**2)-(n*suma_cuadrados))
    print(pendiente)
    bias = mediay-(pendiente*mediax)
    print(bias)
    print("La ecuación de la recta más optimizadora es {}x + {} = y".format(pendiente,bias))
    valori = int(input("Ingrese un valor para predecir con nuestro modelo: "))
    respuesta = (pendiente*valori) + bias
    print("La prediccion es de  {}.".format(respuesta))






def contador(lista_random):
    acumulador=0
    for numero in lista_random:
        acumulador = numero + acumulador
    return acumulador

def promediador(suma,n_datos):
    media=suma/n_datos
    return media

def multiplicador(lista1,lista2):
    acumulador=0
    for i in range(len(lista1)):
        acumulador = acumulador + lista1[i]*lista2[i]
    return acumulador

def cuadrado_de_sumas_x(lista):
    acumulador = 0
    for numero in lista:
        acumulador = acumulador + numero**2
    return acumulador



if __name__ == "__main__":
    print("Hola, calcularemos una recta que se adecua a la nube de puntos de un problema de regresion lineal")
    operacional_function()

Kevin Morales

Luis Fernando Pedroza Taborda

Francisco Garcia [C6]

Carlos José Manosalva

José Guadalupe Hernández Rosas

Paola Rodriguez

Conrado Javier Jiménez Méndez

Xavier Salgado

Alexis Otaño

Christian Sanclemente

Miguel Andres Rendon Reyes

Carli Code

teacher•

Osvaldo Damián Ruiz

Miguel Torres

Walter Alvarado

Deyvi Jhonny Bustamante Perez

Oyarzabal Ivan

Cesar Alejandro Rodriguez Castilo

Miguel Ángel Arévalo Andrade

Gonzalo Gramaglia

Kevin J. Zea Alvarado

Adrian Alberto Rodriguez

Jose Fernando Jaramillo Boon

Jonathan Maita

Pablo Rosa

Mario Esser

Mauro Cortes

Karl Behrens Gil

Cristian Daniel Borda Bastidas

Introducción

Programación Dinámica y Estocástica: Optimización y Modelado de Datos

Programación Dinámica

Programación Dinámica: Optimización de Problemas con Memorización

Optimización de Algoritmos con Programación Dinámica en Python

Caminos Aleatorios

Simulaciones con Caminos Aleatorios en Programación

Camino Aleatorio en Programación Orientada a Objetos

Algoritmo de Caminata Aleatoria en Python: Clase Borracho

Simulación de Caminata Aleatoria con Python

Visualización de Caminatas Aleatorias con Python y Bokeh

Programas Estocásticos

Programación Estocástica: Aplicaciones y Ejemplos Prácticos

Cálculo de Probabilidades y Simulación de Montecarlo

Simulaciones de Probabilidades con Dados en Python

Inferencia Estadística: Conceptos y Aplicaciones Prácticas

Cálculo de la Media Aritmética en Python paso a paso

Media, Varianza y Desviación Estándar en Estadística

Distribución Normal: Propiedades y Aplicaciones Estadísticas

Simulaciones de Montecarlo

Simulaciones de Montecarlo: Historia y Aplicaciones Prácticas

Simulación de Montecarlo para Probabilidades en Juegos de Cartas

Simulaciones de Montecarlo para Aproximar Pi

Estimación de Pi mediante Monte Carlo y Simulación Estadística

Muestreo e Intervalos de Confianza

Muestreo Estadístico: Aleatorio y Estratificado

Teorema del Límite Central: Transformación de Distribuciones

Datos Experimentales

Validación de teorías científicas con datos experimentales