A煤n no tienes acceso a esta clase

Crea una cuenta y contin煤a viendo este curso

Entrenamiento del modelo

13/17
Recursos

Aportes 3

Preguntas 3

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesi贸n.

train_test_split() divide al conjunto de datos al no indicarle la proporcion posiblemente la funciona usa el valor por defecto

Este cap铆tulo me dej贸 unas dudas que resolv铆 investigando un poco.

  1. Al no colocar un test_size, se asume que toma un 75% para train y 25% para test
  2. El .fit lo que har铆a es obtener la media y la desviaci贸n estandar para luego aplicarlo al usar la transformaci贸n.
  3. Al hacer un fit de X, y es para sacar los valores que describo en 2) y aplicarlos al X_train, X_test, y_train, y_test
  4. No siempre es necesario aplicar un fit_transform al target
  5. En caso uses el m茅todo que coloco abajo, debes saber que .fit_transform se aplica a X_train, y_train, y .transform solo se aplica a X_test, y_test

Yo lo hice de esta manera, es otra opci贸n:

from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split

X = data.drop(columns = ['charges'])
y = data[['charges']]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25)

sc_x = StandardScaler()
X_train = sc_x.fit_transform(X_train)
X_test = sc_x.transform(x_test)

sc_y = StandardScaler()
y_train = sc_y.fit_transform(y_train)
y_test = sc_y.transform(y_test)

model = LinearRegression()
model.fit(X_train, y_train)

y_pred = model.predict(X_test)

El entrenamiento del escalador deber铆a ser solo con las variables de entrenamiento, es decir

sc_x.fit(X_train)
sc_y.fit(y_train)