Tu primera regresi贸n lineal con scikit-learn

1/18
Recursos

Aportes 34

Preguntas 2

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

hey, tu, el que esta leyendo esto tu puedes brx!

df.columns=[鈥淐RIM鈥,鈥淶N鈥,鈥淚NDUS鈥 , 鈥淐HAS鈥 ,鈥淣OX鈥,鈥淩M鈥 ,鈥淎GE鈥,鈥淒IS鈥, 鈥淩AD鈥,鈥淭AX鈥, 鈥淧TRATIO鈥, 鈥淏鈥 , 鈥淟STAT鈥 , 鈥淢EDV鈥漖

df.columns=['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV']

import pandas as pd
df = pd.read_csv(鈥https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data鈥,header=None,sep=鈥橽s+鈥)
df.columns=[鈥楥RIM鈥,鈥榋N鈥,鈥業NDUS鈥,鈥楥HAS鈥,鈥楴OX鈥,鈥楻M鈥,鈥楢GE鈥,鈥楧IS鈥,鈥楻AD鈥,鈥楾AX鈥,鈥楶TRATIO鈥,鈥楤鈥,鈥楲STAT鈥,鈥楳EDV鈥橾

df.head()

Quienes hagan el curso a partir de 2023 sepan que el enlace que usar para descargar el Dataset dejo de existir, aqu铆 les dejo el Dataset en Kaggel para que lo descarguen [The Boston Housing Dataset | Kaggle](https://www.kaggle.com/code/prasadperera/the-boston-housing-dataset) [Boston House Prices (kaggle.com)](https://www.kaggle.com/datasets/vikrishnan/boston-house-prices) Si descargan los datos y los suben a su carpeta de google Drive en Collab usen esta linea de c贸digo: from google.colab import drivedrive.mount('/content/drive') Luego copien la direcci贸n donde est谩 su Dataset en la l铆nea de importaci贸n de datos de pandas, tal como lo muestro. import pandas as pd pd.read\_csv('copiar direccion aqu铆')

bien mi gente, de los mejores resumenes de mi vida, todo para ustedes, disfrutenlo y denle corazoncito al deepnote 馃槂
"complementa muy bien el curso asi que aprovechen xD"
https://deepnote.com/@mazzaroli/Regresion-Lineal-con-Python-y-scikit-learn-86f7bb72-770c-4e28-9e84-0355aed93892

Regresi贸n lineal con scikit-learn

La biblioteca Scikit-Learn ofrece una amplia gama de herramientas para realizar an谩lisis de regresi贸n lineal. Aqu铆 tienes un ejemplo b谩sico de c贸mo puedes utilizar Scikit-Learn para realizar una regresi贸n lineal:

  • <h5>Scikit-Learn, tambi茅n conocido como sklearn, es una biblioteca de aprendizaje autom谩tico (machine learning) para el lenguaje de programaci贸n Python. Proporciona una amplia gama de algoritmos y herramientas para tareas de aprendizaje supervisado y no supervisado, incluyendo clasificaci贸n, regresi贸n, agrupamiento (clustering), selecci贸n de caracter铆sticas, preprocesamiento de datos y m谩s.</h5>

Scikit-Learn se construye sobre otras bibliotecas populares de Python, como NumPy y SciPy, y proporciona una interfaz coherente y f谩cil de usar para el desarrollo de modelos de aprendizaje autom谩tico. Es una de las bibliotecas m谩s utilizadas y respetadas en el campo del aprendizaje autom谩tico debido a su simplicidad, eficiencia y enfoque en las mejores pr谩cticas.

Si no les aparece el autocompletado en Google Colab usen:

ctrl + space_bar

import pandas as pd
df = pd.read_csv(鈥https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data鈥, header=None, sep=鈥橽s+鈥)
#El header no existe + Separaci贸n por espacios
#C贸mo las columnas no tienen nombres, se van a reemplazar:
df.columns = [鈥楥RIM鈥,鈥榋N鈥,鈥業NDUS鈥,鈥楥HAS鈥,鈥楴OX鈥,鈥楻M鈥,鈥楢GE鈥,鈥楧IS鈥,鈥楻AD鈥,鈥楾AX鈥,鈥楶TRATIO鈥,鈥楤鈥,鈥楲STAT鈥,鈥楳EDV鈥橾
df.head(5)

use chatgpt para los nombres de las columnas ajajajaj

Update 2023

El link del dataset se cay贸, entonces yo lo a帽adi desde local, ej:

Descargar dataset (housing.data)

import pandas as pd

df = pd.read_csv(
    './housing.data', 
    header=None, # especificamos que el dataset no tiene headers.
    sep='\s+') # especificamos que la separacion esta hecha por espacios y no por comas.

df.columns = ["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]

df.head()
Estoy viendo un curso similar en la especializaci贸n que me ha costado un poco entender. Menos mal existe esto en Platzi para poder afianzar los conocimientos :)
Buen d铆a para todos. Actualizaci贸n al 10 de octubre 2023: ```js import pandas as pd df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+') df.columns=["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"] df.head() ```import pandas as pddf = pd.read\_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+')df.columns=\["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]df.head()

B = 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town

Alguien presto atenci贸n a la columna B?

uffff llegu茅 :3 se va poniendo buena la ruta!

saludos ,
seria genial un curso de actuaria en platzi

Curso de regreseion lineal con Python

蟽 El maestro Luis, nos introduce a 鈥渟eaborn鈥.

  • El cual al parcer se escribe de esta manera " import seaborn as sns "
  • Este nos permite a dar contexto a los graficos que ayudan a entender la relacion entre variables.
    鈥k, muchas cosas interesantes jaja
    1. es ver que se usa el principio una cosa tal 鈥渋mport pandas as pd鈥. enter
    2. Lo siguiente es ver que tiene un " pd.read_csv(鈥pones el link del articulo del que quieres extraer los datos鈥, continua) "
    3. continua justo despues de eso, escribe " hearder = None,continua", esto fue al ver que el encabezado no se esta separando por columnaslo cual significa que no hay Encabezado
    4. " continua ", al ver que no esta separado por comas, lo pone ahora como sev (comma separated value). Entonces Luis escribio, " sep=鈥橽s+鈥 ". Para expresar: lo que se necesita es separacion por espacios.
      -------Lo cual nos dara 13 columnas y un dato numerico.
      NOTA: Las columans por default se ponen en numeros, debido a que esta ocacion no hubo headlinas /encabezados.
      +Pero para sacar los valores de los encabezaos, hay que ir al otro archivo de la web.
      +Para loo encabezos, primero le aclaramos al principio del codigo ahora se pone "df = " lo cual signinca 鈥渄ata frame鈥 .
      Y terminamos con un " df.head() " para que muestre la informacion.
import pandas as pdfile\_path = 'sample\_data/housing.data'data = pd.read\_csv(file\_path, header=None, delim\_whitespace=True)data.columns=\['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV']print(data.head())
JAH BLESS, <https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data> ah铆 est谩 el link para los datos para el 2024 y para los names es este: <https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.names>
Se puede aplicar la regresi贸n lineal para el ejercicio de Kaggle sobre el precio de casas
El ejemplo que dan no esta disponible. Como se puede practicar..... tienen muy desactualizado el curso
Aqu铆 repitiendo el curso para profundizar en la informaci贸n... Seguro podr茅 aplicar un poco mas lo aprendido

C贸digo de la clase:

import pandas as pd
df = pd.read_csv ('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header= None, sep= "\s+")
df.columns = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']
df.head()
馃グ馃グ

Me funciono de esta forma.

import pandas as pd
df = pd.read_csv(鈥https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data鈥, header=None, sep= 鈥淺s+鈥)
df.columns = [鈥淐RIM鈥,鈥淶N鈥,鈥淚NDUS鈥,鈥淐HAS鈥,鈥淣OX鈥,鈥淩M鈥,鈥淎GE鈥,鈥淒IS鈥,鈥淩AD鈥,鈥淭AX鈥,鈥淧TRATIO鈥,鈥淏鈥,鈥淟STAT鈥,鈥淢EDV鈥漖
df.head ()

Parece que no est谩 disponible la p谩gina donde est谩 el dataset de housing. En su lugar, pueden trabajar con el archivo as铆:
(Siempre que el archivo haya sido guardado en drive/My Drive/db/housing.data)

import pandas as pd
from google.colab import drive
drive.mount('/content/drive')
ruta_csv = '/content/drive/My Drive/db/housing.data'
pd.read_csv(ruta_csv)

Para los que les interese, el navegador que utiliza Luis F se llama Brave, super recomendado y no consume tantos recursos

Ya estaba esperando un curso como este, todo este maravilloso camino me ha tra铆do hasta aqu铆 馃敟馃殌馃槑

El curos tiene muy buena pinta, para las personas que batallen en entender pandas, les recomiendo el curso inicio de la misma librer铆a de pandas sus cursos ah铆 son geniales.

Vine buscando respuesta a un problema de econometr铆a y encontr茅 oro x鈥橠
Se ve interesante n.n!!!

Que clase mas chimbita, apenas empiezo mi camino por la DS, espero llegar pronto a este nivel, saludos

Excelente Clase

df.columns = [鈥楥RIM鈥,鈥榋N鈥,鈥業NDUS鈥,鈥楥HAS鈥,鈥楴OX鈥,鈥楻M鈥,鈥楢GE鈥,鈥楧IS鈥,鈥楻AD鈥,鈥楾AX鈥,鈥楶TRATIO鈥,鈥楤鈥,鈥楲STAT鈥,鈥楳EDV鈥橾

Emocionado de empezar este nuevo curso 馃槃
Me interesa mucho este tema鈥