No se trata de lo que quieres comprar, sino de quién quieres ser. Aprovecha el precio especial.

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

15 Días
8 Hrs
32 Min
12 Seg

Tu primera regresión lineal con scikit-learn

1/18
Recursos

Aportes 35

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

hey, tu, el que esta leyendo esto tu puedes brx!

df.columns=[“CRIM”,“ZN”,“INDUS” , “CHAS” ,“NOX”,“RM” ,“AGE”,“DIS”, “RAD”,“TAX”, “PTRATIO”, “B” , “LSTAT” , “MEDV”]

df.columns=['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV']

import pandas as pd
df = pd.read_csv(‘https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data’, header=None, sep=’\s+’)
#El header no existe + Separación por espacios
#Cómo las columnas no tienen nombres, se van a reemplazar:
df.columns = [‘CRIM’,‘ZN’,‘INDUS’,‘CHAS’,‘NOX’,‘RM’,‘AGE’,‘DIS’,‘RAD’,‘TAX’,‘PTRATIO’,‘B’,‘LSTAT’,‘MEDV’]
df.head(5)

Regresión lineal con scikit-learn

La biblioteca Scikit-Learn ofrece una amplia gama de herramientas para realizar análisis de regresión lineal. Aquí tienes un ejemplo básico de cómo puedes utilizar Scikit-Learn para realizar una regresión lineal:

  • <h5>Scikit-Learn, también conocido como sklearn, es una biblioteca de aprendizaje automático (machine learning) para el lenguaje de programación Python. Proporciona una amplia gama de algoritmos y herramientas para tareas de aprendizaje supervisado y no supervisado, incluyendo clasificación, regresión, agrupamiento (clustering), selección de características, preprocesamiento de datos y más.</h5>

Scikit-Learn se construye sobre otras bibliotecas populares de Python, como NumPy y SciPy, y proporciona una interfaz coherente y fácil de usar para el desarrollo de modelos de aprendizaje automático. Es una de las bibliotecas más utilizadas y respetadas en el campo del aprendizaje automático debido a su simplicidad, eficiencia y enfoque en las mejores prácticas.

Estoy viendo un curso similar en la especialización que me ha costado un poco entender. Menos mal existe esto en Platzi para poder afianzar los conocimientos :)

Si no les aparece el autocompletado en Google Colab usen:

ctrl + space_bar

use chatgpt para los nombres de las columnas ajajajaj

Update 2023

El link del dataset se cayó, entonces yo lo añadi desde local, ej:

Descargar dataset (housing.data)

import pandas as pd

df = pd.read_csv(
    './housing.data', 
    header=None, # especificamos que el dataset no tiene headers.
    sep='\s+') # especificamos que la separacion esta hecha por espacios y no por comas.

df.columns = ["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]

df.head()
Buen día para todos. Actualización al 10 de octubre 2023: ```js import pandas as pd df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+') df.columns=["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"] df.head() ```import pandas as pddf = pd.read\_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+')df.columns=\["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]df.head()

B = 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town

Alguien presto atención a la columna B?

uffff llegué :3 se va poniendo buena la ruta!

saludos ,
seria genial un curso de actuaria en platzi

Curso de regreseion lineal con Python

σ El maestro Luis, nos introduce a “seaborn”.

  • El cual al parcer se escribe de esta manera " import seaborn as sns "
  • Este nos permite a dar contexto a los graficos que ayudan a entender la relacion entre variables.
    …Ok, muchas cosas interesantes jaja
    1. es ver que se usa el principio una cosa tal “import pandas as pd”. enter
    2. Lo siguiente es ver que tiene un " pd.read_csv(‘pones el link del articulo del que quieres extraer los datos’, continua) "
    3. continua justo despues de eso, escribe " hearder = None,continua", esto fue al ver que el encabezado no se esta separando por columnaslo cual significa que no hay Encabezado
    4. " continua ", al ver que no esta separado por comas, lo pone ahora como sev (comma separated value). Entonces Luis escribio, " sep=’\s+’ ". Para expresar: lo que se necesita es separacion por espacios.
      -------Lo cual nos dara 13 columnas y un dato numerico.
      NOTA: Las columans por default se ponen en numeros, debido a que esta ocacion no hubo headlinas /encabezados.
      +Pero para sacar los valores de los encabezaos, hay que ir al otro archivo de la web.
      +Para loo encabezos, primero le aclaramos al principio del codigo ahora se pone "df = " lo cual signinca “data frame” .
      Y terminamos con un " df.head() " para que muestre la informacion.
Por si les interesa saber las dimensiones del DataFrame les dejo esta pequeña línea de código: ```python print(f"Las dimensiones del dataframe son {df.shape}") ``` ![](https://static.platzi.com/media/user_upload/image-bf4d9594-164e-4559-9439-b82eabd6a7ff.jpg) Es sencillamente para saber con cuantos datos estamos trabajando.
1. import pandas as pddf = pd.read\_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+')df.columns = \['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']df.head()

Es interesante la forma de extraer columnas y mostrar un dataset de este modo. Me encanto, cada vez mas estoy aprendiendo el concepto de data-science.

Buen inicio de curso. Directamente al notebook 👍
Por favor podria alguien ayudarme explicando como entender el gráfico modifiqué los valores un poco y solo tomé 4 muestras pero aún tengo problemas en comprender porque ese el gráfico de tal manera: ![](https://static.platzi.com/media/user_upload/image-4a63878d-79d1-473c-8dfd-4ae1c44afcc7.jpg)
import pandas as pdfile\_path = 'sample\_data/housing.data'data = pd.read\_csv(file\_path, header=None, delim\_whitespace=True)data.columns=\['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV']print(data.head())
Se puede aplicar la regresión lineal para el ejercicio de Kaggle sobre el precio de casas
El ejemplo que dan no esta disponible. Como se puede practicar..... tienen muy desactualizado el curso
Aquí repitiendo el curso para profundizar en la información... Seguro podré aplicar un poco mas lo aprendido

Código de la clase:

import pandas as pd
df = pd.read_csv ('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header= None, sep= "\s+")
df.columns = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']
df.head()
🥰🥰

Me funciono de esta forma.

import pandas as pd
df = pd.read_csv(“https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data”, header=None, sep= “\s+”)
df.columns = [“CRIM”,“ZN”,“INDUS”,“CHAS”,“NOX”,“RM”,“AGE”,“DIS”,“RAD”,“TAX”,“PTRATIO”,“B”,“LSTAT”,“MEDV”]
df.head ()

Parece que no está disponible la página donde está el dataset de housing. En su lugar, pueden trabajar con el archivo así:
(Siempre que el archivo haya sido guardado en drive/My Drive/db/housing.data)

import pandas as pd
from google.colab import drive
drive.mount('/content/drive')
ruta_csv = '/content/drive/My Drive/db/housing.data'
pd.read_csv(ruta_csv)

Para los que les interese, el navegador que utiliza Luis F se llama Brave, super recomendado y no consume tantos recursos

Ya estaba esperando un curso como este, todo este maravilloso camino me ha traído hasta aquí 🔥🚀😎

El curos tiene muy buena pinta, para las personas que batallen en entender pandas, les recomiendo el curso inicio de la misma librería de pandas sus cursos ahí son geniales.

Vine buscando respuesta a un problema de econometría y encontré oro x’D
Se ve interesante n.n!!!

Que clase mas chimbita, apenas empiezo mi camino por la DS, espero llegar pronto a este nivel, saludos

Excelente Clase

df.columns = [‘CRIM’,‘ZN’,‘INDUS’,‘CHAS’,‘NOX’,‘RM’,‘AGE’,‘DIS’,‘RAD’,‘TAX’,‘PTRATIO’,‘B’,‘LSTAT’,‘MEDV’]

Emocionado de empezar este nuevo curso 😄
Me interesa mucho este tema…