Tu primera regresión lineal con scikit-learn
Clase 1 de 18 • Curso de Regresión Lineal con Python y scikit-learn
Contenido del curso
Clase 1 de 18 • Curso de Regresión Lineal con Python y scikit-learn
Contenido del curso
Jimer Samuel Espinoza
cristian julian mancera bolivar
Antonio Demarco Bonino
FELIX DAVID CORDOVA GARCIA
Luis Fernando Laris Pardo
Juan R. Vergara M.
Nicolás Vrancovich
Ricardo Ruiz
Paolo Joaquin Pinto Perez
Duvan Bernal
Mariana Paniagua Lopera
Erika Alexandra García Barrios
Jhon Freddy Tavera Blandon
Gabriel Obregón
Yahir Olguin Lugo
Ragknos Demian Fernandez Agraz Rodriguez
Fabián Andrés Meneses Morales
Pablo .
Jhonntan Andres Castaño Rojas
Oswaldo Jair García Franco
Jeinfferson Bernal G
Isaac Bryan Ascanoa Roncall
Mario Alexander Vargas Celis
Marcos
Andrés Rugeles
DAN ARIOC RAMBADO
jader lopez
Joel Orellana
Óscar martinez
Marco Carmona
Luis Fernando Laris Pardo
Dick Saide Suárez Blanco
hey, tu, el que esta leyendo esto tu puedes brx!
Graacias !
Gracias & más Gracias que Nunca!
df.columns=["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]
Gracias!
Muchas gracias 🥇
df.columns=['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV']
me sirve
Update 2023
El link del dataset se cayó, entonces yo lo añadi desde local, ej:
Descargar dataset (housing.data)
import pandas as pd df = pd.read_csv( './housing.data', header=None, # especificamos que el dataset no tiene headers. sep='\s+') # especificamos que la separacion esta hecha por espacios y no por comas. df.columns = ["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"] df.head()
Gracias por subir el archivo
Gente que le pone el alma!
import pandas as pd df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+') #El header no existe + Separación por espacios #Cómo las columnas no tienen nombres, se van a reemplazar: df.columns = ['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV'] df.head(5)
Regresión lineal con scikit-learn
La biblioteca Scikit-Learn ofrece una amplia gama de herramientas para realizar análisis de regresión lineal. Aquí tienes un ejemplo básico de cómo puedes utilizar Scikit-Learn para realizar una regresión lineal:
Scikit-Learn, también conocido como sklearn, es una biblioteca de aprendizaje automático (machine learning) para el lenguaje de programación Python. Proporciona una amplia gama de algoritmos y herramientas para tareas de aprendizaje supervisado y no supervisado, incluyendo clasificación, regresión, agrupamiento (clustering), selección de características, preprocesamiento de datos y más.
Scikit-Learn se construye sobre otras bibliotecas populares de Python, como NumPy y SciPy, y proporciona una interfaz coherente y fácil de usar para el desarrollo de modelos de aprendizaje automático. Es una de las bibliotecas más utilizadas y respetadas en el campo del aprendizaje automático debido a su simplicidad, eficiencia y enfoque en las mejores prácticas.
📌Housing Dataset
🛠️ Librerías utilizadas
📥 Carga del dataset
🏘️ Variables del dataset
Cada columna representa una característica de las viviendas o el entorno:
🔎 Verificación de datos
hola, oye no encontre el dataset, y ya intente con la url tambien. como lo encontrate?
Estoy viendo un curso similar en la especialización que me ha costado un poco entender. Menos mal existe esto en Platzi para poder afianzar los conocimientos :)
Si no les aparece el autocompletado en Google Colab usen:
ctrl + space_bar
use chatgpt para los nombres de las columnas ajajajaj
Esta genial. cual fue tu consulta? y como anexaste el archivo?
Buen inicio de curso. Directamente al notebook 👍
Es interesante la forma de extraer columnas y mostrar un dataset de este modo. Me encanto, cada vez mas estoy aprendiendo el concepto de data-science.
Vamos a hacer tu primera regresión lineal usando scikit-learn, una de las bibliotecas más populares de Python para machine learning.
📈 ¿Qué es una regresión lineal?
Es un modelo matemático que relaciona una variable independiente (X) con una variable dependiente (y) a través de una recta:
y=mX+by = mX + b
Donde:
m es la pendienteb es la intersección o término independiente✅ Ejemplo paso a paso con código
1. Importar bibliotecas necesarias
import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression
2. Crear datos de ejemplo
# Datos artificiales X = np.array([[1], [2], [3], [4], [5]]) # variable independiente y = np.array([2, 4, 5, 4, 5]) # variable dependiente
3. Crear y entrenar el modelo
modelo = LinearRegression() modelo.fit(X, y)
4. Ver los coeficientes del modelo
print("Pendiente (coef_):", modelo.coef_) print("Intersección (intercept_):", modelo.intercept_)
5. Hacer predicciones
X_nuevos = np.array([[6], [7]]) predicciones = modelo.predict(X_nuevos) print("Predicciones:", predicciones)
6. Visualizar la regresión
plt.scatter(X, y, color='blue', label='Datos reales') plt.plot(X, modelo.predict(X), color='red', label='Línea de regresión') plt.xlabel("X") plt.ylabel("y") plt.legend() plt.title("Regresión Lineal con scikit-learn") plt.grid(True) plt.show()
🎓 ¿Qué aprendiste?
Con esto lograste:
El ejemplo que dan no esta disponible. Como se puede practicar..... tienen muy desactualizado el curso
Buen día para todos.
Actualización al 10 de octubre 2023:
import pandas as pd df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+') df.columns=["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"] df.head() ```import pandas as pddf = pd.read\_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+')df.columns=\["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]df.head()
B = 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town
Alguien presto atención a la columna B?
si rarisima creo que es la cantidad de personas negras en el pueblo, yo recien estoy explorando y esta columna me llamo mucho la atencion. tu que pudiste observar de esta columna?
uffff llegué :3 se va poniendo buena la ruta!
saludos , seria genial un curso de actuaria en platzi
Actuaría como tal es una carrera, pero hay varías rutas dentro de Platzi que sirven para actuaría.
Justamente, se podría más bien tener un curso de cálculo de riesgos para seguros o cálculo de riesgos aplicados y hablar de el Valor en Riesgo y cómo se calcula jaja aunque uno siempre puede empezar aprendiendo probabilidad, estadística y ver sus aplicaciones en seguros y finanzas ;)
Curso de regreseion lineal con Python
σ El maestro Luis, nos introduce a "seaborn".