CursosEmpresasBlogLiveConfPrecios

Tu primera regresión lineal con scikit-learn

Clase 1 de 18 • Curso de Regresión Lineal con Python y scikit-learn

Clase anteriorSiguiente clase

Contenido del curso

Introducción al curso

  • 1
    Tu primera regresión lineal con scikit-learn

    Tu primera regresión lineal con scikit-learn

    Viendo ahora
  • 2
    Análisis de datos para tu primera regresión lineal

    Análisis de datos para tu primera regresión lineal

    09:49 min
  • 3
    Entrenando un modelo de regresión lineal con scikit-learn

    Entrenando un modelo de regresión lineal con scikit-learn

    14:01 min

Cómo funciona la regresión lineal

  • 4
    ¿Qué es la regresión lineal?

    ¿Qué es la regresión lineal?

    04:26 min
  • 5
    Cuándo utilizar un modelo de regresión lineal

    Cuándo utilizar un modelo de regresión lineal

    03:53 min
  • 6
    Función de pérdida y optimización: mínimos cuadrados

    Función de pérdida y optimización: mínimos cuadrados

    06:10 min
  • 7
    Evaluando el modelo: R^2 y MSE

    Evaluando el modelo: R^2 y MSE

    04:49 min

Regresión lineal multivariable

  • 8
    Regresión lineal multivariable

    Regresión lineal multivariable

    03:45 min
  • 9
    Análisis de regresión multivariable

    Análisis de regresión multivariable

    14:20 min

Proyecto práctico

  • 10
    Regresión lineal para predecir los gastos médicos de pacientes

    Regresión lineal para predecir los gastos médicos de pacientes

    04:15 min
  • 11
    Exploración y preparación de datos

    Exploración y preparación de datos

    07:49 min
  • 12
    Análisis de correlación de los datos

    Análisis de correlación de los datos

    09:57 min
  • 13
    Entrenamiento del modelo

    Entrenamiento del modelo

    10:40 min
  • 14
    Evaluando el modelo

    Evaluando el modelo

    13:20 min
  • 15
    Mejorando el modelo

    Mejorando el modelo

    13:59 min

Pasos siguientes

  • 16
    ¿Qué hay más allá de la linealidad?

    ¿Qué hay más allá de la linealidad?

    04:26 min
  • 17
    Siguientes pasos en modelos de inteligencia artificial

    Siguientes pasos en modelos de inteligencia artificial

    02:11 min
  • 18

    Comparte tu proyecto de regresión lineal y certifícate

Tomar examen

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads
        Jimer Samuel Espinoza

        Jimer Samuel Espinoza

        student•
        hace 4 años

        hey, tu, el que esta leyendo esto tu puedes brx!

          cristian julian mancera bolivar

          cristian julian mancera bolivar

          student•
          hace 4 años

          Graacias !

          Antonio Demarco Bonino

          Antonio Demarco Bonino

          student•
          hace 4 años

          Gracias & más Gracias que Nunca!

        FELIX  DAVID CORDOVA GARCIA

        FELIX DAVID CORDOVA GARCIA

        student•
        hace 4 años

        df.columns=["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]

          Luis Fernando Laris Pardo

          Luis Fernando Laris Pardo

          student•
          hace 4 años

          Gracias!

          Juan R. Vergara M.

          Juan R. Vergara M.

          student•
          hace 3 años

          Muchas gracias 🥇

        Nicolás Vrancovich

        Nicolás Vrancovich

        student•
        hace 4 años
        df.columns=['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV']
          Ricardo Ruiz

          Ricardo Ruiz

          student•
          hace un año

          me sirve

        Paolo Joaquin Pinto Perez

        Paolo Joaquin Pinto Perez

        student•
        hace 3 años

        Update 2023

        El link del dataset se cayó, entonces yo lo añadi desde local, ej:

        Descargar dataset (housing.data)

        import pandas as pd df = pd.read_csv( './housing.data', header=None, # especificamos que el dataset no tiene headers. sep='\s+') # especificamos que la separacion esta hecha por espacios y no por comas. df.columns = ["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"] df.head()
          Duvan Bernal

          Duvan Bernal

          student•
          hace un año

          Gracias por subir el archivo

          Mariana Paniagua Lopera

          Mariana Paniagua Lopera

          student•
          hace 5 meses

          Gente que le pone el alma!

        Erika Alexandra García Barrios

        Erika Alexandra García Barrios

        student•
        hace 4 años

        import pandas as pd df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+') #El header no existe + Separación por espacios #Cómo las columnas no tienen nombres, se van a reemplazar: df.columns = ['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV'] df.head(5)

        Jhon Freddy Tavera Blandon

        Jhon Freddy Tavera Blandon

        student•
        hace 3 años

        Regresión lineal con scikit-learn

        La biblioteca Scikit-Learn ofrece una amplia gama de herramientas para realizar análisis de regresión lineal. Aquí tienes un ejemplo básico de cómo puedes utilizar Scikit-Learn para realizar una regresión lineal:

        • Scikit-Learn, también conocido como sklearn, es una biblioteca de aprendizaje automático (machine learning) para el lenguaje de programación Python. Proporciona una amplia gama de algoritmos y herramientas para tareas de aprendizaje supervisado y no supervisado, incluyendo clasificación, regresión, agrupamiento (clustering), selección de características, preprocesamiento de datos y más.

        Scikit-Learn se construye sobre otras bibliotecas populares de Python, como NumPy y SciPy, y proporciona una interfaz coherente y fácil de usar para el desarrollo de modelos de aprendizaje automático. Es una de las bibliotecas más utilizadas y respetadas en el campo del aprendizaje automático debido a su simplicidad, eficiencia y enfoque en las mejores prácticas.

        Ragknos Demian Fernandez Agraz Rodriguez

        Ragknos Demian Fernandez Agraz Rodriguez

        student•
        hace 2 años
        1. import pandas as pddf = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+')df.columns = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']df.head()
        Gabriel Obregón

        Gabriel Obregón

        student•
        hace 4 meses

        📌Housing Dataset

        🛠️ Librerías utilizadas

        • 📊 pandas (pd) → manejo de datos
        • 📈 seaborn (sns) → gráficos estadísticos
        • 🎨 matplotlib.pyplot (plt) → visualización general
        • 🔢 numpy (np) → operaciones numéricas
        • ⚖️ StandardScaler → normalización de variables
        • 📐 LinearRegression → modelo de regresión lineal

        📥 Carga del dataset

        • 🌐 Fuente: UCI Machine Learning Repository
        • 📂 Archivo: housing.data
        • ⚙️ Opciones de carga:
          • header=None → sin encabezados
          • sep='\s+' → valores separados por espacios
        • 📌 Resultado → datos guardados en df (DataFrame)

        🏘️ Variables del dataset

        Cada columna representa una característica de las viviendas o el entorno:

        • 🚨 CRIM → criminalidad per cápita
        • 🏡 ZN → terrenos residenciales (lotes grandes)
        • 🏭 INDUS → acres de negocios no minoristas
        • 🌊 CHAS → límite con río Charles (1 = sí, 0 = no)
        • ☁️ NOX → concentración de óxidos nítricos
        • 🛏️ RM → número promedio de habitaciones
        • ⏳ AGE → % de casas construidas antes de 1940
        • 🚶 DIS → distancia ponderada a centros de empleo
        • 🛣️ RAD → accesibilidad radial a autopistas
        • 💰 TAX → tasa de impuesto a la propiedad
        • 📚 PTRATIO → relación alumno-profesor
        • 👥 B → proporción de población afroamericana (ajustada)
        • 📉 LSTAT → % de población con bajo estatus socioeconómico
        • 🏠 MEDV → valor medio de las viviendas (en miles de $)

        🔎 Verificación de datos

        • 🖥️ Comando: df.head()
        • Permite comprobar: ✅ Datos cargados correctamente ✅ Columnas con nombres asignados
          Yahir Olguin Lugo

          Yahir Olguin Lugo

          student•
          hace 4 meses

          hola, oye no encontre el dataset, y ya intente con la url tambien. como lo encontrate?

        Fabián Andrés  Meneses Morales

        Fabián Andrés Meneses Morales

        student•
        hace 2 años

        Estoy viendo un curso similar en la especialización que me ha costado un poco entender. Menos mal existe esto en Platzi para poder afianzar los conocimientos :)

        Pablo .

        Pablo .

        student•
        hace 3 años

        Si no les aparece el autocompletado en Google Colab usen:

        ctrl + space_bar
        Jhonntan Andres Castaño Rojas

        Jhonntan Andres Castaño Rojas

        student•
        hace 3 años

        use chatgpt para los nombres de las columnas ajajajaj

          Oswaldo Jair García Franco

          Oswaldo Jair García Franco

          student•
          hace 3 años

          Esta genial. cual fue tu consulta? y como anexaste el archivo?

        Jeinfferson Bernal G

        Jeinfferson Bernal G

        student•
        hace 2 años

        Buen inicio de curso. Directamente al notebook 👍

        Isaac Bryan Ascanoa Roncall

        Isaac Bryan Ascanoa Roncall

        student•
        hace 2 años

        Es interesante la forma de extraer columnas y mostrar un dataset de este modo. Me encanto, cada vez mas estoy aprendiendo el concepto de data-science.

        Mario Alexander Vargas Celis

        Mario Alexander Vargas Celis

        student•
        hace 6 meses

        Vamos a hacer tu primera regresión lineal usando scikit-learn, una de las bibliotecas más populares de Python para machine learning.

        📈 ¿Qué es una regresión lineal?

        Es un modelo matemático que relaciona una variable independiente (X) con una variable dependiente (y) a través de una recta:

        y=mX+by = mX + b

        Donde:

        • m es la pendiente
        • b es la intersección o término independiente

        ✅ Ejemplo paso a paso con código

        1. Importar bibliotecas necesarias

        import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression

        2. Crear datos de ejemplo

        # Datos artificiales X = np.array([[1], [2], [3], [4], [5]]) # variable independiente y = np.array([2, 4, 5, 4, 5]) # variable dependiente

        3. Crear y entrenar el modelo

        modelo = LinearRegression() modelo.fit(X, y)

        4. Ver los coeficientes del modelo

        print("Pendiente (coef_):", modelo.coef_) print("Intersección (intercept_):", modelo.intercept_)

        5. Hacer predicciones

        X_nuevos = np.array([[6], [7]]) predicciones = modelo.predict(X_nuevos) print("Predicciones:", predicciones)

        6. Visualizar la regresión

        plt.scatter(X, y, color='blue', label='Datos reales') plt.plot(X, modelo.predict(X), color='red', label='Línea de regresión') plt.xlabel("X") plt.ylabel("y") plt.legend() plt.title("Regresión Lineal con scikit-learn") plt.grid(True) plt.show()

        🎓 ¿Qué aprendiste?

        Con esto lograste:

        • Crear un modelo de regresión lineal
        • Ajustarlo con datos reales
        • Predecir nuevos valores
        • Visualizar la línea de mejor ajuste
        Marcos

        Marcos

        student•
        hace 2 años

        El ejemplo que dan no esta disponible. Como se puede practicar..... tienen muy desactualizado el curso

        Andrés Rugeles

        Andrés Rugeles

        student•
        hace 2 años

        Buen día para todos.

        Actualización al 10 de octubre 2023:

        import pandas as pd df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+') df.columns=["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"] df.head() ```import pandas as pddf = pd.read\_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+')df.columns=\["CRIM","ZN","INDUS" , "CHAS" ,"NOX","RM" ,"AGE","DIS", "RAD","TAX", "PTRATIO", "B" , "LSTAT" , "MEDV"]df.head()
        DAN ARIOC RAMBADO

        DAN ARIOC RAMBADO

        student•
        hace 4 años

        B = 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town

        Alguien presto atención a la columna B?

          jader lopez

          jader lopez

          student•
          hace 3 años

          si rarisima creo que es la cantidad de personas negras en el pueblo, yo recien estoy explorando y esta columna me llamo mucho la atencion. tu que pudiste observar de esta columna?

        Joel Orellana

        Joel Orellana

        student•
        hace 3 años

        uffff llegué :3 se va poniendo buena la ruta!

        Óscar martinez

        Óscar martinez

        student•
        hace 4 años

        saludos , seria genial un curso de actuaria en platzi

          Marco Carmona

          Marco Carmona

          student•
          hace 4 años

          Actuaría como tal es una carrera, pero hay varías rutas dentro de Platzi que sirven para actuaría.

          Luis Fernando Laris Pardo

          Luis Fernando Laris Pardo

          student•
          hace 4 años

          Justamente, se podría más bien tener un curso de cálculo de riesgos para seguros o cálculo de riesgos aplicados y hablar de el Valor en Riesgo y cómo se calcula jaja aunque uno siempre puede empezar aprendiendo probabilidad, estadística y ver sus aplicaciones en seguros y finanzas ;)

        Dick Saide Suárez Blanco

        Dick Saide Suárez Blanco

        student•
        hace 4 años

        Curso de regreseion lineal con Python

        σ El maestro Luis, nos introduce a "seaborn".

        • El cual al parcer se escribe de esta manera " import seaborn as sns "
        • Este nos permite a dar contexto a los graficos que ayudan a entender la relacion entre variables. ...Ok, muchas cosas interesantes jaja
          1. es ver que se usa el principio una cosa tal "import pandas as pd". enter
          2. Lo siguiente es ver que tiene un " pd.read_csv('pones el link del articulo del que quieres extraer los datos', continua) "
          3. continua justo despues de eso, escribe " hearder = None,continua", esto fue al ver que el encabezado no se esta separando por columnaslo cual significa que no hay Encabezado
          4. " continua ", al ver que no esta separado por comas, lo pone ahora como sev (comma separated value). Entonces Luis escribio, " sep='\s+' ". Para expresar: lo que se necesita es separacion por espacios. -------Lo cual nos dara 13 columnas y un dato numerico. NOTA: Las columans por default se ponen en numeros, debido a que esta ocacion no hubo headlinas /encabezados. +Pero para sacar los valores de los encabezaos, hay que ir al otro archivo de la web. +Para loo encabezos, primero le aclaramos al principio del codigo ahora se pone "df = " lo cual signinca "data frame" . Y terminamos con un " df.head() " para que muestre la informacion.