CursosEmpresasBlogLiveConfPrecios

Tu primera regresión lineal con scikit-learn

Clase 1 de 18 • Curso de Regresión Lineal con Python y scikit-learn

Clase anteriorSiguiente clase

Contenido del curso

Introducción al curso
  • 1
    Tu primera regresión lineal con scikit-learn

    Tu primera regresión lineal con scikit-learn

    09:00
  • 2
    Análisis de datos para tu primera regresión lineal

    Análisis de datos para tu primera regresión lineal

    09:49
  • 3
    Entrenando un modelo de regresión lineal con scikit-learn

    Entrenando un modelo de regresión lineal con scikit-learn

    14:01
Cómo funciona la regresión lineal
  • 4
    ¿Qué es la regresión lineal?

    ¿Qué es la regresión lineal?

    04:26
  • 5
    Cuándo utilizar un modelo de regresión lineal

    Cuándo utilizar un modelo de regresión lineal

    03:53
  • 6
    Función de pérdida y optimización: mínimos cuadrados

    Función de pérdida y optimización: mínimos cuadrados

    06:10
  • 7
    Evaluando el modelo: R^2 y MSE

    Evaluando el modelo: R^2 y MSE

    04:49
  • quiz de Cómo funciona la regresión lineal

Regresión lineal multivariable
  • 8
    Regresión lineal multivariable

    Regresión lineal multivariable

    03:45
  • 9
    Análisis de regresión multivariable

    Análisis de regresión multivariable

    14:20
Proyecto práctico
  • 10
    Regresión lineal para predecir los gastos médicos de pacientes

    Regresión lineal para predecir los gastos médicos de pacientes

    04:15
  • 11
    Exploración y preparación de datos

    Exploración y preparación de datos

    07:49
  • 12
    Análisis de correlación de los datos

    Análisis de correlación de los datos

    09:57
  • 13
    Entrenamiento del modelo

    Entrenamiento del modelo

    10:40
  • 14
    Evaluando el modelo

    Evaluando el modelo

    13:20
  • 15
    Mejorando el modelo

    Mejorando el modelo

    13:59
  • quiz de Proyecto práctico

Pasos siguientes
  • 16
    ¿Qué hay más allá de la linealidad?

    ¿Qué hay más allá de la linealidad?

    04:26
  • 17
    Siguientes pasos en modelos de inteligencia artificial

    Siguientes pasos en modelos de inteligencia artificial

    02:11
  • 18

    Comparte tu proyecto de regresión lineal y certifícate

    00:00
    Jimer Samuel Espinoza

    Jimer Samuel Espinoza

    student•
    hace 4 años

    hey, tu, el que esta leyendo esto tu puedes brx!

      cristian julian mancera bolivar

      cristian julian mancera bolivar

      student•
      hace 3 años

      Graacias !

      Antonio Demarco Bonino

      Antonio Demarco Bonino

      student•
      hace 3 años

      Gracias & más Gracias que Nunca!

    FELIX  DAVID CORDOVA GARCIA

    FELIX DAVID CORDOVA GARCIA

    student•
    hace 4 años

    df.columns=["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]

      Luis Fernando Laris Pardo

      Luis Fernando Laris Pardo

      student•
      hace 4 años

      Gracias!

      Juan R. Vergara M.

      Juan R. Vergara M.

      student•
      hace 3 años

      Muchas gracias 🥇

    Nicolás Vrancovich

    Nicolás Vrancovich

    student•
    hace 4 años
    df.columns=['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV']
      Ricardo Ruiz

      Ricardo Ruiz

      student•
      hace 9 meses

      me sirve

    Paolo Joaquin Pinto Perez

    Paolo Joaquin Pinto Perez

    student•
    hace 3 años

    Update 2023

    El link del dataset se cayó, entonces yo lo añadi desde local, ej:

    Descargar dataset (housing.data)

    import pandas as pd df = pd.read_csv( './housing.data', header=None, # especificamos que el dataset no tiene headers. sep='\s+') # especificamos que la separacion esta hecha por espacios y no por comas. df.columns = ["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"] df.head()
      Duvan Bernal

      Duvan Bernal

      student•
      hace un año

      Gracias por subir el archivo

      Mariana Paniagua Lopera

      Mariana Paniagua Lopera

      student•
      hace 3 meses

      Gente que le pone el alma!

    Erika Alexandra García Barrios

    Erika Alexandra García Barrios

    student•
    hace 4 años

    import pandas as pd df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+') #El header no existe + Separación por espacios #Cómo las columnas no tienen nombres, se van a reemplazar: df.columns = ['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV'] df.head(5)

    Jhon Freddy Tavera Blandon

    Jhon Freddy Tavera Blandon

    student•
    hace 2 años

    Regresión lineal con scikit-learn

    La biblioteca Scikit-Learn ofrece una amplia gama de herramientas para realizar análisis de regresión lineal. Aquí tienes un ejemplo básico de cómo puedes utilizar Scikit-Learn para realizar una regresión lineal:

    • Scikit-Learn, también conocido como sklearn, es una biblioteca de aprendizaje automático (machine learning) para el lenguaje de programación Python. Proporciona una amplia gama de algoritmos y herramientas para tareas de aprendizaje supervisado y no supervisado, incluyendo clasificación, regresión, agrupamiento (clustering), selección de características, preprocesamiento de datos y más.

    Scikit-Learn se construye sobre otras bibliotecas populares de Python, como NumPy y SciPy, y proporciona una interfaz coherente y fácil de usar para el desarrollo de modelos de aprendizaje automático. Es una de las bibliotecas más utilizadas y respetadas en el campo del aprendizaje automático debido a su simplicidad, eficiencia y enfoque en las mejores prácticas.

    Ragknos Demian Fernandez Agraz Rodriguez

    Ragknos Demian Fernandez Agraz Rodriguez

    student•
    hace 2 años
    1. import pandas as pddf = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+')df.columns = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']df.head()
    Gabriel Obregón

    Gabriel Obregón

    student•
    hace 2 meses

    📌Housing Dataset

    🛠️ Librerías utilizadas

    • 📊 pandas (pd) → manejo de datos
    • 📈 seaborn (sns) → gráficos estadísticos
    • 🎨 matplotlib.pyplot (plt) → visualización general
    • 🔢 numpy (np) → operaciones numéricas
    • ⚖️ StandardScaler → normalización de variables
    • 📐 LinearRegression → modelo de regresión lineal

    📥 Carga del dataset

    • 🌐 Fuente: UCI Machine Learning Repository
    • 📂 Archivo: housing.data
    • ⚙️ Opciones de carga:
      • header=None → sin encabezados
      • sep='\s+' → valores separados por espacios
    • 📌 Resultado → datos guardados en df (DataFrame)

    🏘️ Variables del dataset

    Cada columna representa una característica de las viviendas o el entorno:

    • 🚨 CRIM → criminalidad per cápita
    • 🏡 ZN → terrenos residenciales (lotes grandes)
    • 🏭 INDUS → acres de negocios no minoristas
    • 🌊 CHAS → límite con río Charles (1 = sí, 0 = no)
    • ☁️ NOX → concentración de óxidos nítricos
    • 🛏️ RM → número promedio de habitaciones
    • ⏳ AGE → % de casas construidas antes de 1940
    • 🚶 DIS → distancia ponderada a centros de empleo
    • 🛣️ RAD → accesibilidad radial a autopistas
    • 💰 TAX → tasa de impuesto a la propiedad
    • 📚 PTRATIO → relación alumno-profesor
    • 👥 B → proporción de población afroamericana (ajustada)
    • 📉 LSTAT → % de población con bajo estatus socioeconómico
    • 🏠 MEDV → valor medio de las viviendas (en miles de $)

    🔎 Verificación de datos

    • 🖥️ Comando: df.head()
    • Permite comprobar: ✅ Datos cargados correctamente ✅ Columnas con nombres asignados
      Yahir Olguin Lugo

      Yahir Olguin Lugo

      student•
      hace 2 meses

      hola, oye no encontre el dataset, y ya intente con la url tambien. como lo encontrate?

    Fabián Andrés  Meneses Morales

    Fabián Andrés Meneses Morales

    student•
    hace 2 años

    Estoy viendo un curso similar en la especialización que me ha costado un poco entender. Menos mal existe esto en Platzi para poder afianzar los conocimientos :)

    Pablo .

    Pablo .

    student•
    hace 3 años

    Si no les aparece el autocompletado en Google Colab usen:

    ctrl + space_bar
    Jhonntan Andres Castaño Rojas

    Jhonntan Andres Castaño Rojas

    student•
    hace 3 años

    use chatgpt para los nombres de las columnas ajajajaj

      Oswaldo Jair García Franco

      Oswaldo Jair García Franco

      student•
      hace 3 años

      Esta genial. cual fue tu consulta? y como anexaste el archivo?

    Jeinfferson Bernal G

    Jeinfferson Bernal G

    student•
    hace 2 años

    Buen inicio de curso. Directamente al notebook 👍

    Isaac Bryan Ascanoa Roncall

    Isaac Bryan Ascanoa Roncall

    student•
    hace 2 años

    Es interesante la forma de extraer columnas y mostrar un dataset de este modo. Me encanto, cada vez mas estoy aprendiendo el concepto de data-science.

    Mario Alexander Vargas Celis

    Mario Alexander Vargas Celis

    student•
    hace 4 meses

    Vamos a hacer tu primera regresión lineal usando scikit-learn, una de las bibliotecas más populares de Python para machine learning.

    📈 ¿Qué es una regresión lineal?

    Es un modelo matemático que relaciona una variable independiente (X) con una variable dependiente (y) a través de una recta:

    y=mX+by = mX + b

    Donde:

    • m es la pendiente
    • b es la intersección o término independiente

    ✅ Ejemplo paso a paso con código

    1. Importar bibliotecas necesarias

    import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression

    2. Crear datos de ejemplo

    # Datos artificiales X = np.array([[1], [2], [3], [4], [5]]) # variable independiente y = np.array([2, 4, 5, 4, 5]) # variable dependiente

    3. Crear y entrenar el modelo

    modelo = LinearRegression() modelo.fit(X, y)

    4. Ver los coeficientes del modelo

    print("Pendiente (coef_):", modelo.coef_) print("Intersección (intercept_):", modelo.intercept_)

    5. Hacer predicciones

    X_nuevos = np.array([[6], [7]]) predicciones = modelo.predict(X_nuevos) print("Predicciones:", predicciones)

    6. Visualizar la regresión

    plt.scatter(X, y, color='blue', label='Datos reales') plt.plot(X, modelo.predict(X), color='red', label='Línea de regresión') plt.xlabel("X") plt.ylabel("y") plt.legend() plt.title("Regresión Lineal con scikit-learn") plt.grid(True) plt.show()

    🎓 ¿Qué aprendiste?

    Con esto lograste:

    • Crear un modelo de regresión lineal
    • Ajustarlo con datos reales
    • Predecir nuevos valores
    • Visualizar la línea de mejor ajuste
    Marcos

    Marcos

    student•
    hace 2 años

    El ejemplo que dan no esta disponible. Como se puede practicar..... tienen muy desactualizado el curso

    Andrés Rugeles

    Andrés Rugeles

    student•
    hace 2 años

    Buen día para todos.

    Actualización al 10 de octubre 2023:

    import pandas as pd df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+') df.columns=["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"] df.head() ```import pandas as pddf = pd.read\_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+')df.columns=\["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]df.head()
    DAN ARIOC RAMBADO

    DAN ARIOC RAMBADO

    student•
    hace 3 años

    B = 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town

    Alguien presto atención a la columna B?

      jader lopez

      jader lopez

      student•
      hace 3 años

      si rarisima creo que es la cantidad de personas negras en el pueblo, yo recien estoy explorando y esta columna me llamo mucho la atencion. tu que pudiste observar de esta columna?

    Joel Orellana

    Joel Orellana

    student•
    hace 3 años

    uffff llegué :3 se va poniendo buena la ruta!

    Óscar martinez

    Óscar martinez

    student•
    hace 4 años

    saludos , seria genial un curso de actuaria en platzi

      Marco Carmona

      Marco Carmona

      student•
      hace 4 años

      Actuaría como tal es una carrera, pero hay varías rutas dentro de Platzi que sirven para actuaría.

      Luis Fernando Laris Pardo

      Luis Fernando Laris Pardo

      student•
      hace 4 años

      Justamente, se podría más bien tener un curso de cálculo de riesgos para seguros o cálculo de riesgos aplicados y hablar de el Valor en Riesgo y cómo se calcula jaja aunque uno siempre puede empezar aprendiendo probabilidad, estadística y ver sus aplicaciones en seguros y finanzas ;)

    Dick Saide Suárez Blanco

    Dick Saide Suárez Blanco

    student•
    hace 3 años

    Curso de regreseion lineal con Python

    σ El maestro Luis, nos introduce a "seaborn".

    • El cual al parcer se escribe de esta manera " import seaborn as sns "
    • Este nos permite a dar contexto a los graficos que ayudan a entender la relacion entre variables. ...Ok, muchas cosas interesantes jaja
      1. es ver que se usa el principio una cosa tal "import pandas as pd". enter
      2. Lo siguiente es ver que tiene un " pd.read_csv('pones el link del articulo del que quieres extraer los datos', continua) "
      3. continua justo despues de eso, escribe " hearder = None,continua", esto fue al ver que el encabezado no se esta separando por columnaslo cual significa que no hay Encabezado
      4. " continua ", al ver que no esta separado por comas, lo pone ahora como sev (comma separated value). Entonces Luis escribio, " sep='\s+' ". Para expresar: lo que se necesita es separacion por espacios. -------Lo cual nos dara 13 columnas y un dato numerico. NOTA: Las columans por default se ponen en numeros, debido a que esta ocacion no hubo headlinas /encabezados. +Pero para sacar los valores de los encabezaos, hay que ir al otro archivo de la web. +Para loo encabezos, primero le aclaramos al principio del codigo ahora se pone "df = " lo cual signinca "data frame" . Y terminamos con un " df.head() " para que muestre la informacion.

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads