Aprender los conceptos clave

1

Todo lo que aprenderás sobre MA con Scikit-Learn

2

¿Cómo aprenden las máquinas?

3

Problemas que podemos resolver con Scikit-learn

4

Las matemáticas que vamos a necesitar

Iniciar un proyecto con sklearn

5

Configuración de nuestro entorno Python

6

Instalación de librerías en Python

7

Datasets que usaremos en el curso

Optimización de features

8

¿Cómo afectan nuestros features a los modelos de Machine Learning?

9

Introducción al PCA

10

Preparación de datos para PCA e IPCA

11

Implementación del algoritmo PCA e IPCA

12

Kernels y KPCA

13

¿Qué es la regularización y cómo aplicarla?

14

Implementación de Lasso y Ridge

15

Explicación resultado de la implementación

16

ElasticNet: Una técnica intermedia

Regresiones robustas

17

El problema de los valores atípicos

18

Regresiones Robustas en Scikit-learn

19

Preparación de datos para la regresión robusta

20

Implementación regresión robusta

Métodos de ensamble aplicados a clasificación

21

¿Qué son los métodos de ensamble?

22

Preparación de datos para implementar métodos de ensamble

23

Implementación de Bagging

24

Implementación de Boosting

Clustering

25

Estrategias de Clustering

26

Implementación de Batch K-Means

27

Implementación de Mean-Shift

Optimización paramétrica

28

Validación de nuestro modelo usando Cross Validation

29

Implementación de K-Folds Cross Validation

30

Optimización paramétrica

31

Implementación de Randomized

32

Bonus: Auto Machine Learning

Salida a producción

33

Revisión de nuestra arquitectura de código

34

Importar y exportar modelos con Sklearn

35

Creación de una API con Flask para el modelo

36

Cierre del curso

37

Material adicional para consultar

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Convierte tus certificados en títulos universitarios en USA

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

18 Días
0 Hrs
57 Min
32 Seg

Revisión de nuestra arquitectura de código

33/37
Recursos

Aportes 24

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

El que hizo el curso en Colab:
D:

Al inicio fue muy raro trabajar con los datasets desde el editor de código y no desde jupyter, pero ahora todo tiene sentido. Se ve excelente la forma de terminar este curso.

Excelente clase, ojalá poder dar likes a las clases que más te gustan 😅

<h3>Resumen</h3>

Revisión de nuestra arquitectura de código

Ahora vamos a convertir los scripts que tenemos en un código que sea modular y extensible con facilidad para que nuestra arquitectura pueda salir a producción de una manera exitosa.

Una estructura de carpetas que sea organizada para poder gestionar todo lo que vas a necesitar en cualquier proceso de Machine Learning.

Carpetas:

  • in: Carpeta que contendrá archivos de entrada, datos que alimentarán a nuestros modelos.
  • out: Carpeta que contendrá el resultado de la exportacion de nuestros modelos, visualizaciones, datos en excel o csv, etc.
  • models: Carpeta que contedrá a los modelos.

Archivos:
Cada clase será un archivo que tenga su propia responsabilidad y se encargue específicamente de una tareas concreta.

  • main.py: Metodo principal de ejecucion. Ejecutará todo el flujo de datos. Se encargaría de controlar el flujo de todo el código de principio a fin.
  • load.py: Archivo que se encarga de cargar los datos desde in o una DB
  • utils.py: Todos los metodos que se reutilizaran una y otra vez.
  • models.py: Irá toda la parte de ML como tal.

.
.
Repositorio del Proyecto

Muy buena clase. Muchas gracias

Este curso aunque ya tiene unos 4 años (sabemos como transcurre el tiempo de rápido en tecnología) es de los mejores que he tomado aquí. Con ningún otro hasta ahora había tocado el tema de la puesta en producción 🥇🚀🔥🤖🦾

Para aquellos que utilizan Jupyter Notebooks desde Visual Studio Code, pueden importar cualquier notebook (.ipynb) , instalando el módulo de python import_ipynb

El código para llamar Utils sería:


import import_ipynb
from utils import Utils

Lo pueden instalar con pip

!pip install import_ipynb

¡Saludos!👑

En cuanto a mysql creo que no seria un gran problema, con mysql workbench puedes convertir tus archivos .sql a archivos .csv.

nice amigo…me pareció excelente incorporar poo en proyectos de data science

Al ver esta clase me dio gusto haber llevado POO en la Uni por 6 meses.

Pero, no se preocupen, aquí en Platzi también se puede aprender:

Esta clase fue buenisima y se complementa muy bien con lo visto en el curso de POO del principio

Recuerden que vimos algo similar para la gente que lo hace en google colar, deep note o jupiter en el curos de manejo de datos faltantes.

%run(LA DIRECCION DE NUESTRO ARCHIVO)

#ejemplo si tenemos nuentreo archivo .ipynb en la misma carpeta
%run pandas-missing-extension.ipynb

asi que se puede hacer lo mismo en google colap, eso si , el modulo que ustedes vayan a crear es mejor que cuente con un decorador para facilitar la busqueda del metodo que necesitan.

@pd.api.extensions.register_dataframe_accessor("missing")

Muy interesante la arquitectura

La clase se centra en la creación de una arquitectura de código modular y organizada para salir a producción en proyectos de Machine Learning con scikit-learn. Se sugieren estructuras de carpetas para gestionar datos, resultados y modelos. Se discuten archivos clave como `main.py`, `utils.py`, y `models.py`, cada uno con funciones específicas para facilitar la reutilización y mantenimiento del código. El enfoque se orienta a mantener un flujo de trabajo limpio y eficiente, permitiendo ajustes sin alterar la lógica principal.
Una de las grandes ventajas de usar scripts, es que ver las modificaciones en git es mucho mas simple. Además no es tan pesado como en notebooks.
Me encantan las clases en la que se habla de POO. Para dejar más claro todo dejo los principales conceptos aquí. 1\) Herencia: La herencia es un mecanismo de la POO que permite que una clase (clase hija o subclase) herede propiedades y métodos de otra clase (clase padre o superclase). Esto permite reutilizar el código existente sin necesidad de reescribirlo, y facilita la creación de jerarquías de clases. 2\) Encapsulamiento: El encapsulamiento es la técnica de agrupar datos (atributos) y funciones (métodos) dentro de una misma clase y restringir el acceso directo a algunos de los componentes de un objeto. Esto se hace para proteger los datos y asegurar que solo se puedan modificar de forma controlada a través de métodos especiales llamados "getters" y "setters". 3\) Polimorfismo: El polimorfismo es la capacidad de un objeto de tomar diferentes formas. En POO, permite que un mismo método funcione de diferentes maneras, dependiendo del objeto que lo llame. Un mismo nombre de método puede tener diferentes comportamientos en distintas clases relacionadas por herencia. 4\) Abstracción: La abstracción es el proceso de simplificar un sistema complejo ocultando los detalles innecesarios y mostrando solo las funcionalidades esenciales. En POO, se logra mediante el uso de clases abstractas o interfaces que definen comportamientos que luego serán implementados por otras clases.
De las clases mas top que he visto en platzi.
Que pedazo de curso!!!

La arquitectura de código, a menudo conocida como arquitectura de software, se refiere a la estructura y organización del código fuente de un programa o sistema de software. Una arquitectura de código bien diseñada es esencial para desarrollar software que sea mantenible, escalable, flexible y fácil de entender

Like por más cursos como este, lo he disfrutado mucho 🚀🔥💯🥇

La única desventaja que puede tener trabajar con CLASES en proyectos pequeños es que la implementación de clases podría aumentar la cantidad de código necesario para realizar tareas relativamente simples. En proyectos más pequeños, donde la funcionalidad adicional proporcionada por las clases puede no ser necesaria, el uso de este enfoque puede parecer excesivo y agregar una sobrecarga en términos de complejidad y cantidad de líneas de código.

En tales casos, una implementación más sencilla y procedural podría ser suficiente para cumplir con los objetivos del proyecto, sin la necesidad de introducir la estructura adicional que conlleva el uso de clases.

Es importante tener en cuenta que esta desventaja es específica de proyectos pequeños o simples, ya que en proyectos más grandes y complejos, la programación orientada a objetos y el uso de clases se vuelve más valiosa para lograr la modularidad, la reutilización de código y un diseño más mantenible y escalable. La elección de utilizar clases o no, dependerá de la naturaleza y alcance del proyecto, así como de las necesidades y preferencias del equipo de desarrollo.

Yo haciendo todo en kaggle … igual puedo adjuntar foto de la estructura de un proyecto jajaja.

No entiendo por qué? me sale este error, en el archivo utils tengo como parámetros de la función self y path.

Traceback (most recent call last):
File “Platzi/scikitPlatzi/main.py”, line 6, in <module>
data = utils.load_from_csv(’./in/felicidad.csv’)
TypeError: load_from_csv() missing 1 required positional argument: ‘path’

Tengo un problema con la librería utils con Anaconda. Cuanto intento instalar utils mediante “conda install utils”, no me lo permite.

Luego utilizo el “pip install utils” y si me deja instalar pero Visual Studio Code no lo reconoce ni sale en conda list.

Por útilmo utilizo “python -m pip install utils”, se instala. Visual Studio Code si lo reconoce y sale en conda list, pero a la hora de ejecutar el código me sale el siguiente error:

“ImportError: cannot import name ‘Utils’ from ‘utils’ (/home/demarquezs/anaconda3/envs/ML/lib/python3.10/site-packages/utils/init.py)”

¿Me podrían ayudar por favor?