CursosEmpresasBlogLiveConfPrecios

Procesamiento y Análisis de Datos para Machine Learning

Clase 6 de 17 • Curso de Introducción a Machine Learning

Contenido del curso

Introducción a machine learning

  • 1
    Curso actualizado

    Curso actualizado

    00:05 min
  • 2
    Algoritmos de Machine Learning: Preparación y Aplicación de Datos

    Algoritmos de Machine Learning: Preparación y Aplicación de Datos

    02:03 min
  • 3
    Introducción al Machine Learning: Historia y Conceptos Básicos

    Introducción al Machine Learning: Historia y Conceptos Básicos

    04:01 min
  • 4
    Introducción a la Ciencia de Datos: Carga y Visualización de Conjuntos

    Introducción a la Ciencia de Datos: Carga y Visualización de Conjuntos

    13:00 min
  • 5
    Algoritmos Supervisados y No Supervisados en Machine Learning

    Algoritmos Supervisados y No Supervisados en Machine Learning

    05:46 min
  • 6
    Procesamiento y Análisis de Datos para Machine Learning

    Procesamiento y Análisis de Datos para Machine Learning

    Viendo ahora

Algoritmos simples de machine learning

  • 7
    Modelos de Machine Learning: Uso, Implementación y Evaluación

    Modelos de Machine Learning: Uso, Implementación y Evaluación

    04:16 min
  • 8
    Regresión Lineal: Predicción y Evaluación de Modelos Numéricos

    Regresión Lineal: Predicción y Evaluación de Modelos Numéricos

    04:56 min
  • 9
    Regresión Logística: Clasificación y Predicción de Probabilidades

    Regresión Logística: Clasificación y Predicción de Probabilidades

    04:31 min
  • 10
    Clasificadores de Bosque Aleatorio: Conceptos y Aplicaciones

    Clasificadores de Bosque Aleatorio: Conceptos y Aplicaciones

    05:47 min
  • 11
    Aprendizaje No Supervisado: Clustering con K-means

    Aprendizaje No Supervisado: Clustering con K-means

    08:38 min
  • 12
    Guía práctica de algoritmos de machine learning con scikit-learn

    Guía práctica de algoritmos de machine learning con scikit-learn

    01:03 min

Deep learning

  • 13
    Fundamentos de Redes Neuronales y Deep Learning

    Fundamentos de Redes Neuronales y Deep Learning

    07:57 min
  • 14
    Mejora de Redes Neuronales: Ajuste, Overfitting y Dropout

    Mejora de Redes Neuronales: Ajuste, Overfitting y Dropout

    03:37 min
  • 15
    Entrenamiento Efectivo de Redes Neuronales: Arquitectura y Tasa de Aprendizaje

    Entrenamiento Efectivo de Redes Neuronales: Arquitectura y Tasa de Aprendizaje

    07:38 min

Conclusiones

  • 16
    Curso de Fundamentos Prácticos de Machine Learning

    Curso de Fundamentos Prácticos de Machine Learning

    01:18 min
  • 17
    Resumen del Curso de Machine Learning y Habilidades Avanzadas

    Resumen del Curso de Machine Learning y Habilidades Avanzadas

    01:57 min
Tomar examen

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads

      ¡Hola! Te doy la bienvenida a esta clase donde comenzaremos a poner a prueba lo que has aprendido en los cursos previos de ciencia de datos e inteligencia artificial de Platzi y en este.

      Recuerda que para avanzar con esta clase deberás haber tomado los siguientes cursos:

      • Curso de Entorno de Trabajo para Ciencia de Datos con Jupyter Notebooks y Anaconda
      • Curso Básico de Python
      • Curso de Python: Comprehensions, Lambdas y Manejo de Errores
      • Curso de Matemáticas para Data Science: Estadística Descriptiva
      • Curso Práctico de Regresión Lineal con Python
      • Curso de Matemáticas para Data Science: Cálculo Básico
      • Curso de Matemáticas para Data Science: Probabilidad
      • Curso de Fundamentos de Álgebra Lineal con Python
      • Curso de Principios de Visualización de Datos para Business Intelligence
      • Curso de Manipulación y Análisis de Datos con Pandas y Python
      • Curso de Álgebra Lineal Aplicada para Machine Learning

      Te reitero que es muy importante que conozcas estos temas y ya tengas las habilidades para que puedas aprender con facilidad y seguir con el curso hasta el final. Aprender machine learning en un principio no es una tarea sencilla, pero con la preparación adecuada y dedicación podemos obtener este conocimiento de forma trascendental.

      Let’s go for it! 💪

      Nuestra notebook de ejercicios

      Para esta clase tendrás una notebook en Google Colab donde encontrarás piezas de código con explicaciones sobre el paso a paso para procesar y analizar un dataset antes de comenzar a aplicar algoritmos de machine learning.

      Accede al notebook aquí.

      Crea una copia de este notebook en tu Google Drive o utilizalo en el entorno de Jupyter notebook que prefieras.

      En el notebook también encontrarás ejercicios que deberás resolver por tu cuenta. Sigue las instrucciones dentro del notebook y comparte tus resultados en los comentarios de esta clase.

      En dado caso de que tengas alguna duda o no puedas completar alguno de los ejercicios, al final del notebook encontrarás una sección con las respuestas, pero antes de revisarlas da el máximo esfuerzo para realizar los ejercicios. Así aprenderás mucho más.

      De igual forma te invito a que dejes en comentarios cualquier duda, dificultad o pregunta que tengas al momento de seguir el notebook y realizar los ejercicios. Con mucho gusto la comunidad de Platzi te ayudará.


      ¡Te deseo mucho éxito y nos vemos en el próximo módulo! Comenzaremos a detallar los diferentes modelos que existen de machine learning. 🧠

      Comentarios

        Aaron Fabrizio Calderon Guillermo

        Aaron Fabrizio Calderon Guillermo

        student•
        hace 4 años

        Pienso que también se debería compartir Notebooks comentados para el resto de cursos, ayudan mucho.

          Jorge Andrés Robledo Ariza

          Jorge Andrés Robledo Ariza

          student•
          hace 4 años

          Demasiado... No me imaginé que me quedaría muy claro cada detalle de esa manera.

          Heberto Nicolás Hernández Andrade

          Heberto Nicolás Hernández Andrade

          student•
          hace 4 años

          Definitivo, el notebook está increíble para aprender a nuestro ritmo.

        Daniel Pérez

        Daniel Pérez

        student•
        hace 4 años

        Hay una herramienta muy buena para gráficar llamada Seaborn. Es un wrapper de matplotlib pero considero tiene mejores funcionalidades y una mejor sintaxis, permite realizar gráficos más atractivos.

        Screen Shot 2021-12-19 at 7.56.21 AM.png
        import seaborn as sns data['Diabetes']=data.apply( lambda row: 'Diabetic' if row.Outcome == 1 else 'Notdiabetic', axis=1) sns.scatterplot(x='BloodPressure', y='Age', hue='Diabetes', data=data, style='Diabetes', alpha=0.80, palette=['purple', '#55CCCC'] ).set(title='Blood Pressure v. Age range of patients')```
          David Gonzalez

          David Gonzalez

          student•
          hace 3 años

          Si, te ahorras mucho códgo con esa librería!

          Diego Jurado

          Diego Jurado

          student•
          hace 3 años

          Y que te parece Plotly?

        Jonathan Fernando Santana Quispillo

        Jonathan Fernando Santana Quispillo

        student•
        hace 4 años

        Resultados de preguntas del reto 2a: P1: variables categóricas. P2: variables cuantitativas. P3: variable cuantitativas. Por favor feedback con respecto a las respuestas.

          Julian Crispin

          Julian Crispin

          student•
          hace 4 años

          P1. Cada categoria se podria representar como un entero P2. Es una variable cuantitativa continua, y se repesenta como un float P3. la misma que P2

          Diego Jurado

          Diego Jurado

          student•
          hace 3 años

          De acuerdo con tu respuesta Jonathan!

        Jose Luis Higuera Caraveo

        Jose Luis Higuera Caraveo

        student•
        hace 4 años

        Este es mi código a los retos:

        RETO 1:

        binvalues = [20, 25, 30, 35, 40, 85] plt.figure(figsize=(10,8)) plt.subplot(1,1,1) plt.hist(data['Age'], bins=binvalues, facecolor="g", alpha=0.4, edgecolor='black', linewidth=2) plt.title("Age range of patients") plt.ylim([0,510]) plt.xlabel("Age") plt.ylabel("Count") ax = plt.gca() ax.spines['right'].set_color('none') ax.spines['top'].set_color('none') plt.show()

        Resultado:

        reto1.PNG

        RETO 2:

        plt.figure(figsize=(10,8)) plt.subplot(1,1,1) plt.hist(data['Age'], bins=5, facecolor="g", alpha=0.4, edgecolor='black', linewidth=2) plt.title("Age range of patients") plt.ylim([0,510]) plt.xlabel("Age") plt.ylabel("Count") ax = plt.gca() ax.spines['right'].set_color('none') ax.spines['top'].set_color('none') plt.show()

        Resultado:

        Reto2.PNG

        RETO 3:

        diabetic = data[data["Outcome"] == 1] notdiabetic = data[data["Outcome"] == 0] plt.rcParams['font.size'] = 15 f = plt.figure(figsize=(8,8)) ax = f.add_subplot(2,1,1) ax.scatter(diabetic["BloodPressure"], diabetic["Age"], alpha=0.25, c='r') ax.set_title("Diabetic: Age range of patients v. Blood Pressure") ax.set_ylabel("Age") ax.set_xlabel("Blood Pressure") ax = f.add_subplot(2,1,2) ax.scatter(notdiabetic["BloodPressure"], notdiabetic["Age"], alpha=0.25, c='b') ax.set_title("Not diabetic: Age range of patients v. Blood Pressure") ax.set_ylabel("Age") ax.set_xlabel("Blood Pressure") ax.spines['right'].set_color('none') ax.spines['top'].set_color('none') f.tight_layout()

        Resultado:

        reto3.PNG

        Es muy notable que las personas de menor edad están concentradas en la gráfica de Not diabetic. Además, su Blod Pressure ronda entre los 60 a 100.

        David Coello

        David Coello

        student•
        hace 4 años

        Seaborn nos permite realizar Histogramas o Scatterplots y discrimar con algún feature en específico, por ejemplo:

        El histograma del rango de edades de los pacientes y si son diabéticos o no diabéticos

        Screenshot 2022-09-03 210112.png
        #Creamos nueva columna para diabetes y no diabetes #Realizamos un mapeo entre el outcome y su respectivo valor categórico df_diabetes['Patient'] = df_diabetes['Outcome'].map({0: 'Not Diabetic', 1: 'Diabetic'}) plt.rcParams['font.size'] = 15 fig = plt.figure(figsize=(8,4)) ax = fig.add_subplot(1,1,1) #Realizamos histograma con edad sns.histplot(data= df_diabetes, x= 'Age', hue= 'Patient') # Crea el título. ax.set_title("Age Range of Patients") fig.tight_layout()

        Lo mismo podemos realizar con un Scatterplot

        Screenshot 2022-09-03 210431.png
        #Para ello la columna 'Patient' Ya debió haber sido creada #Scatterplot entre Edad y Presión sanguínea plt.rcParams['font.size'] = 15 fig = plt.figure(figsize=(8,4)) #Subplot ax = fig.add_subplot(1,1,1) #Graficamos sns.scatterplot(data=df_diabetes, x= 'BloodPressure', y= 'Age', hue= 'Patient',alpha=0.8) #Título plt.title("Blood pressure vs. age range of patients") fig.tight_layout()
        Ciro Villafraz

        Ciro Villafraz

        student•
        hace 4 años
        2021-11-16.png
        David Carrillo Castillo

        David Carrillo Castillo

        student•
        hace 3 años

        Reto 1 (3a)

        reto11.png
        reto111.png
          Mario Chavez

          Mario Chavez

          student•
          hace 3 años

          Puedes usar enumerate() para no tener que declarar un contador en el for.

        Fernando Callasaca Acuña

        Fernando Callasaca Acuña

        student•
        hace 3 años

        Aquí les comparto mi aporte con seaborn y cambiando de ejes.

        diabetic.png

        Y aquí el código:

        plt.figure(figsize=(10,5)) sns.scatterplot(x = 'Age', y = 'BloodPressure', data = data, hue = 'Outcome', alpha = 0.75, style='Outcome') plt.legend(['Diabéticos', 'No Diabéticos']) plt.title('Presión Sanguinea v. Edad: Pacientes con/sin Diabetes') plt.ylabel('Presión Sanguinea') plt.xlabel('Edad') plt.show()
        Eliana Ossio

        Eliana Ossio

        student•
        hace un año

        Preguntas del reto:

        Pregunta 1: Datos categóricos

        Pregunta 2: Valores continuos (float64)

        Pregunta 3: Valores continuos (float64)

        Jonathan Fernando Santana Quispillo

        Jonathan Fernando Santana Quispillo

        student•
        hace 4 años

        Resultados de preguntas del reto 4: P1: vsupervisado-regresión. P2: supervisado-clasificación. P3: no supervisado-clustering.

        Juan Alberto Solís Castro

        Juan Alberto Solís Castro

        student•
        hace 2 años

        3a: Ejercicio del reto 2

        ## TU CODIGO AQUI

        f = plt.figure(figsize=(8, 4))

        ax = f.add_subplot(1, 1, 1)

        # Usar 5 bins

        data["Age"].hist(ax=ax, bins=5, edgecolor='black', linewidth=1)

        ax.set_title("Age range of patients")

        ax.set_ylim([0, 510]) # Mantener el límite de y en [0, 510]

        ax.set_xlabel("Age")

        ax.set_ylabel("Count")

        f.tight_layout()

        ```js

        TU CODIGO AQUI

        f = plt.figure(figsize=(8, 4)) ax = f.add_subplot(1, 1, 1)

        Usar 5 bins

        data["Age"].hist(ax=ax, bins=5, edgecolor='black', linewidth=1)

        ax.set_title("Age range of patients") ax.set_ylim([0, 510]) # Mantener el límite de y en [0, 510] ax.set_xlabel("Age") ax.set_ylabel("Count") f.tight_layout()

        Wilder Winslao Trujillo Meza

        Wilder Winslao Trujillo Meza

        student•
        hace un año

        El Curso Práctico de Regresión Lineal con Python No está funcionando

        María José Barrera Chávez

        María José Barrera Chávez

        student•
        hace 2 años

        Hola! El enlace de Curso Práctico de Regresión Lineal con Python no funciona

        Nicolás Rodas Rios

        Nicolás Rodas Rios

        student•
        hace 3 años

        Pregunta 1 Tipo object Pregunta 2 Tipo float64 Pregunta 3 Tipo int64

        Tomas Dale

        Tomas Dale

        student•
        hace 4 años

        De reto, los de dispersion

        Si tiene diabetes no hay correlacion entre presion arterial y edad PERO SI NO TIENE DIABETES SI HAY CORRELACION ENTRE EDAD BAJA Y PRESION ARTERIAL BAJA

        Anthony Guzman Lopez

        Anthony Guzman Lopez

        student•
        hace 4 años

        Info del reto:

        Screenshot from 2021-10-14 20-30-35.png
        Screenshot from 2021-10-14 20-30-46.png
        Screenshot from 2021-10-14 20-30-58.png
        Screenshot from 2021-10-14 20-31-08.png
          ISMAEL FARID COHEN PUERTA

          ISMAEL FARID COHEN PUERTA

          student•
          hace 4 años

          Hola a Todos, por acá dejo respuestas del reto. Pregunta1: Categórico, pues el # de productos es finito. P2: Si es en pesos colombianos, se puede interpretar como Entero; si es en dolares, se puede interpretar como flotante (este caso admite centavos). P3: Flotante, pues admite decimales. Saludos.

        Juan felipe Becerra

        Juan felipe Becerra

        student•
        hace 6 meses

        2a: Preguntas del reto

        A partir de las siguientes preguntas, debes identificar el tipo de datos que se usaría en cada situación. Deja tus resultados en los comentarios de la clase donde encontraste este notebook.

        Pregunta 1

        Tienes un conjunto de datos de información de ventas sobre equipos electrónicos. Una de las columnas del conjunto de datos describe qué es el producto: tableta, teléfono inteligente, TV, computadora. ¿Qué tipo de datos es este? 

        Rt// categorial

        Pregunta 2 A partir del mismo conjunto de datos de equipos electrónicos anterior, tienes información sobre el precio de cada artículo. ¿Qué tipo de datos es este? 

        Rta//Numerical

        Pregunta 3 Tienes información sobre el kilometraje (distancia recorrida) de varios automóviles en un concesionario. ¿Qué tipo de información es esta?

        Rta//Numerical

        4: Preguntas del reto

        A continuación, te daré un par de ejemplos para tratar de comprender qué tipos de modelos debería utilizar. Responde en los comentarios de la clase a qué tipo de algoritmo se refiere la situación.

        Pregunta 1

        Tienes un conjunto de datos de una empresa de ropa y deseas predecir el volumen de ventas de vestidos en el próximo mes. ¿Qué tipo de problema es? 

        Rta//Supervisado y Regresión

        Pregunta 2

        Al igual que en la primera pregunta, estás utilizando un conjunto de datos de ropa. En lugar de predecir el volumen de ventas, querrás saber si venderás al menos 1000 de un determinado tipo de vestido. ¿Qué tipo de problema es este? 

        Rta//Supervisado y Clasificación

        Pregunta 3

        Tienes información sobre cómo compran ropa los clientes en tu tienda. Tienes un conjunto de datos de sus compras, segmentado en categorías: la cantidad de pantalones, camisas, vestidos y faldas que compra cada cliente. Deseas segmentar a tus clientes en diferentes grupos para poder enviar anuncios a cada grupo, según lo que quieran usar. ¿Qué tipo de problema podría ser este?

        Rta//Aprendizaje no supervisado - Clustering

        Alex Eduardo Nocua Sema

        Alex Eduardo Nocua Sema

        student•
        hace 7 meses

        Pregunta 1

        Tienes un conjunto de datos de una empresa de ropa y deseas predecir el volumen de ventas de vestidos en el próximo mes. ¿Qué tipo de problema es?

        RTA: Aprendizaje supervisado de regresión.

        Pregunta 2

        Al igual que en la primera pregunta, estás utilizando un conjunto de datos de ropa. En lugar de predecir el volumen de ventas, querrás saber si venderás al menos 1000 de un determinado tipo de vestido. ¿Qué tipo de problema es este?

        RTA: Aprendizaje supervisado de clasificación.

        Pregunta 3

        Tienes información sobre cómo compran ropa los clientes en tu tienda. Tienes un conjunto de datos de sus compras, segmentado en categorías: la cantidad de pantalones, camisas, vestidos y faldas que compra cada cliente. Deseas segmentar a tus clientes en diferentes grupos para poder enviar anuncios a cada grupo, según lo que quieran usar. ¿Qué tipo de problema podría ser este?

        RTA: Aprendizaje no supervisado por clustering.

        Alex Eduardo Nocua Sema

        Alex Eduardo Nocua Sema

        student•
        hace 7 meses

        Este es el desarrollo de mi punto 3.

        Alex Eduardo Nocua Sema

        Alex Eduardo Nocua Sema

        student•
        hace 7 meses

        Pregunta 1

        Tienes un conjunto de datos de información de ventas sobre equipos electrónicos. Una de las columnas del conjunto de datos describe qué es el producto: tableta, teléfono inteligente, TV, computadora. ¿Qué tipo de datos es este?

        Estos tipos de datos hacen parte de los categóricos nominales, esto ya que en si cada uno de las columnas se podrían representar como variable no numéricas, estos son categorías por decirlo así, no existe un orden entre las categorías, es decir, un teléfono no es mas o menos que una TV, solo son clases diferentes.

        Pregunta 2 A partir del mismo conjunto de datos de equipos electrónicos anterior, tienes información sobre el precio de cada artículo. ¿Qué tipo de datos es este?

        Este ya seria del tipo numérico continuo, esto debido a que es un numero que se puede representar con los números reales, osea puede incluir cualquier valor en una rango incluyendo decimales, no es específicamente un numero determinado o entero, esto lo convertiría en un timo numérico discreto.

        Pregunta 3 Tienes información sobre el kilometraje (distancia recorrida) de varios automóviles en un concesionario. ¿Qué tipo de información es esta?

        Este es un tipo de información numérico cuantitativa, debido a que representan una característica medible.