Jimer Samuel Espinoza
Estudiantecristian julian mancera bolivar
EstudianteAntonio Demarco Bonino
EstudianteFELIX DAVID CORDOVA GARCIA
EstudianteLuis Fernando Laris Pardo
EstudianteJuan R. Vergara M.
EstudianteNicolás Vrancovich
EstudianteRicardo Ruiz
EstudiantePaolo Joaquin Pinto Perez
EstudianteDuvan Bernal
EstudianteMariana Paniagua Lopera
EstudianteErika Alexandra García Barrios
EstudianteJhon Freddy Tavera Blandon
EstudianteGabriel Obregón
EstudianteYahir Olguin Lugo
EstudianteRagknos Demian Fernandez Agraz Rodriguez
EstudianteFabián Andrés Meneses Morales
EstudiantePablo .
EstudianteJhonntan Andres Castaño Rojas
EstudianteOswaldo Jair García Franco
EstudianteJeinfferson Bernal G
EstudianteIsaac Bryan Ascanoa Roncall
EstudianteMario Alexander Vargas Celis
EstudianteMarcos
EstudianteAndrés Rugeles
EstudianteDAN ARIOC RAMBADO
Estudiantejader lopez
EstudianteJoel Orellana
EstudianteÓscar martinez
EstudianteMarco Carmona
EstudianteLuis Fernando Laris Pardo
EstudianteDick Saide Suárez Blanco
Estudiantehey, tu, el que esta leyendo esto tu puedes brx!
Graacias !
Gracias & más Gracias que Nunca!
df.columns=["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]
Gracias!
Muchas gracias 🥇
df.columns=['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV']
me sirve
Update 2023
El link del dataset se cayó, entonces yo lo añadi desde local, ej:
Descargar dataset (housing.data)
import pandas as pd df = pd.read_csv( './housing.data', header=None, # especificamos que el dataset no tiene headers. sep='\s+') # especificamos que la separacion esta hecha por espacios y no por comas. df.columns = ["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"] df.head()
Gracias por subir el archivo
Gente que le pone el alma!
import pandas as pd df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+') #El header no existe + Separación por espacios #Cómo las columnas no tienen nombres, se van a reemplazar: df.columns = ['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV'] df.head(5)
Regresión lineal con scikit-learn
La biblioteca Scikit-Learn ofrece una amplia gama de herramientas para realizar análisis de regresión lineal. Aquí tienes un ejemplo básico de cómo puedes utilizar Scikit-Learn para realizar una regresión lineal:
Scikit-Learn, también conocido como sklearn, es una biblioteca de aprendizaje automático (machine learning) para el lenguaje de programación Python. Proporciona una amplia gama de algoritmos y herramientas para tareas de aprendizaje supervisado y no supervisado, incluyendo clasificación, regresión, agrupamiento (clustering), selección de características, preprocesamiento de datos y más.
Scikit-Learn se construye sobre otras bibliotecas populares de Python, como NumPy y SciPy, y proporciona una interfaz coherente y fácil de usar para el desarrollo de modelos de aprendizaje automático. Es una de las bibliotecas más utilizadas y respetadas en el campo del aprendizaje automático debido a su simplicidad, eficiencia y enfoque en las mejores prácticas.
📌Housing Dataset
🛠️ Librerías utilizadas
📥 Carga del dataset
🏘️ Variables del dataset
Cada columna representa una característica de las viviendas o el entorno:
🔎 Verificación de datos
hola, oye no encontre el dataset, y ya intente con la url tambien. como lo encontrate?
Estoy viendo un curso similar en la especialización que me ha costado un poco entender. Menos mal existe esto en Platzi para poder afianzar los conocimientos :)
Si no les aparece el autocompletado en Google Colab usen:
ctrl + space_bar
use chatgpt para los nombres de las columnas ajajajaj
Esta genial. cual fue tu consulta? y como anexaste el archivo?
Buen inicio de curso. Directamente al notebook 👍
Es interesante la forma de extraer columnas y mostrar un dataset de este modo. Me encanto, cada vez mas estoy aprendiendo el concepto de data-science.
Vamos a hacer tu primera regresión lineal usando scikit-learn, una de las bibliotecas más populares de Python para machine learning.
📈 ¿Qué es una regresión lineal?
Es un modelo matemático que relaciona una variable independiente (X) con una variable dependiente (y) a través de una recta:
y=mX+by = mX + b
Donde:
m es la pendienteb es la intersección o término independiente✅ Ejemplo paso a paso con código
1. Importar bibliotecas necesarias
import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression
2. Crear datos de ejemplo
# Datos artificiales X = np.array([[1], [2], [3], [4], [5]]) # variable independiente y = np.array([2, 4, 5, 4, 5]) # variable dependiente
3. Crear y entrenar el modelo
modelo = LinearRegression() modelo.fit(X, y)
4. Ver los coeficientes del modelo
print("Pendiente (coef_):", modelo.coef_) print("Intersección (intercept_):", modelo.intercept_)
5. Hacer predicciones
X_nuevos = np.array([[6], [7]]) predicciones = modelo.predict(X_nuevos) print("Predicciones:", predicciones)
6. Visualizar la regresión
plt.scatter(X, y, color='blue', label='Datos reales') plt.plot(X, modelo.predict(X), color='red', label='Línea de regresión') plt.xlabel("X") plt.ylabel("y") plt.legend() plt.title("Regresión Lineal con scikit-learn") plt.grid(True) plt.show()
🎓 ¿Qué aprendiste?
Con esto lograste:
El ejemplo que dan no esta disponible. Como se puede practicar..... tienen muy desactualizado el curso
Buen día para todos.
Actualización al 10 de octubre 2023:
import pandas as pd df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+') df.columns=["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"] df.head() ```import pandas as pddf = pd.read\_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+')df.columns=\["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]df.head()
B = 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town
Alguien presto atención a la columna B?
si rarisima creo que es la cantidad de personas negras en el pueblo, yo recien estoy explorando y esta columna me llamo mucho la atencion. tu que pudiste observar de esta columna?
uffff llegué :3 se va poniendo buena la ruta!
saludos , seria genial un curso de actuaria en platzi
Actuaría como tal es una carrera, pero hay varías rutas dentro de Platzi que sirven para actuaría.
Justamente, se podría más bien tener un curso de cálculo de riesgos para seguros o cálculo de riesgos aplicados y hablar de el Valor en Riesgo y cómo se calcula jaja aunque uno siempre puede empezar aprendiendo probabilidad, estadística y ver sus aplicaciones en seguros y finanzas ;)
Curso de regreseion lineal con Python
σ El maestro Luis, nos introduce a "seaborn".