Más modelos canonicos

Clase 16 de 35 • Curso Profesional de Data Science 2016

Resumen

La vectorización de ese modelo de negocios realmente es el primer paso para poder hacerle un modelo predictivo.

De nuevo, ¿sabes? personalmente tengo esta creencia de que muchas de las entidades del mundo real, las personas en un nivel emocional y nuestras interacciones en el mundo, pueden ser codificadas en números, pueden ser codificadas en términos matemáticos y esto es de lo que se trata realmente convertir cosas en vectores.

También hemos hablado sobre codificar imágenes, video, etc. en espacio vectorial, hablamos sobre que cada imágen tendrá diferentes pixeles, cada pixel tendrá un valor para el color que este toma, y al convertir estos valores en una gran lista, en un gran vector, los números que de nuevo, existen cómo un punto en largo espacio de n dimensiones. Y lo que hemos hecho es codificar esa entidad del mundo real en números.

Y entonces conforme progresas en Machine Learning vas encontrando formas cada vez más creativas de hacerlo.

Vamos a hacer este proceso en un ejemplo en breve, digamos que para nuestra tarea de predicción para predecir el número de mililitros de medicamento a administrar en un hospital.

Tenemos cien diferentes pacientes, y cada uno existe en el espacio tridimensional, lo que significa que tienen 3 características. Así que nuestro set de entrenamiento, nuestra matriz de entrenamiento va a ser de (100 x 3) va a tener cien filas y tres columnas.

A continuación tenemos un vector de respuestas, de el número de mililitros que históricamente, ha sido administrado a cada uno de estos pacientes. Y entonces, nuestro set de entrenamiento de (100 x 3) y nuestro vector, el cual efectivamente tiene cien diferentes columnas si quieres pensar verticalmente, y una sola columna.

Una vez que codificamos las cosas al espacio vectorial, para poder pasarlas a nuestro modelo de Machine Learning, así es como nuestra data se tiene que ver.

Cuando construimos modelos de machine learning todo es un "hiper parámetro" en otras palabras todo es una perilla que puedes girar o no girar.

Desde las características que creas para tus datos, para los modelos que eliges, para los hiper parámetros con los que parametrizas esos modelos.

Comentarios

Juan Carlos Quishpe

student•

En este video “mas modelos canonicos” no hay subtitulos desde el minuto 10:00 en adelante. Favor habilitar los subtitulos.

Ricardo Celis

teacher•

Hola @juancarlosquishpe. Estamos resolviendo eso, el servidor donde están los subs falló pero ya se está solucionando gracias por avisarnos =)

Diego Diaz

student•

no se soluciona aun. me rindo con este curso.

JIMMY ALEXANDER CRUZ QUINTERO

student•

Los subtítulos en español de este video desde el minuto 10 no aparecen.

Diego Forero

Team Platzi•

Gracias por el reporte, lo solucionaremos lo más pronto posible.

José Pillado

student•

Yeah! álgebra matricial ❤️

Enmanuel Madrid

student•

El video tiene problema con los subtitulos en algunas partes

Diego Forero

Team Platzi•

Gracias por el reporte, estamos revisando que esta pasando y lo solucionaremos tan pronto sea posible.

Juan Pedro Emilio Lipari

student•

Puede ser que aveces los videos tarden tiempo en cargar? en youtube cargo rápido pero aquí está tardando. gracias

Ricardo Celis

teacher•

Hola pedro cuando eso pasa puedes intentar cambiar de servidor, cuéntame que tal te funciona

Gabriel Oliveira

student•

El proceso de validacion cruzada es muy delicado e incluso complejo

Andres Apostol

student•

Hola los subtitulos en el servidor B y C no estan disponibles y en el servidor A aparecen es al segundo 00:23
SO: Ubuntu y Navegador: Firefox

Más modelos canonicos

Bienvenido al curso

¿Cómo activar los subtítulos para este curso?

Bienvenido al curso profesional de Data Science

Llevar tus cosas a Producción

Llevar tus cosas a producción

Bases de datos: SQL o NoSQL

ETL

Mostrar tus datos mediante dashboards

Repaso por Jupyter Notebook

Ejemplo de inferencia en twitter para producción

Creando nuestro modelo matematico

Automatización

Llevar tus cosas a producción

Machine Learning

Un poco de contexto sobre machine learning

Entrenando un modelo de Machine Learning

Modelos de regresión, clasificación, clustering y reducción de dimensionalidad

Modelos canónicos y para que los usamos

Más modelos canonicos

Itera rápido o muere lento

Recolectando y limpiando nuestros datos

Implementando nuestros modelos de Machine Learning

Creando y ejecutando nuestro pipeline

Machine Learning

Estadística

Estadística y su aplicación en Data Science

Distribuciones de probabilidad

Inferencia estadística

Ejemplo de un modelo estadístico en un Testing A/B

Estadística

Herramientas clave que usa un data scientist

Herramientas que todos necesitamos

Servicios en la nube de Amazon: AWS / EC2

Obteniendo y explorando datos desde nuestra línea de comandos

Git

Construyendo un equipo de data science

Construyendo un equipo de Data Science

Ingenieros de datos, creadores de producto y data scientists

¿Qué sigue?

¿Qué sigue?

Cierre del curso

Contenido complementario