Demo con Scikit: división de datos

Clase 19 de 27 • Curso de Introducción a Machine Learning 2019

Contenido del curso

Conceptos básicos de Machine Learning

Trabajando con Pytorch

Implementaciones de algoritmos de Machine Learning en Pytorch

Redes Neurales y reconocimiento de imágenes

Reconocimiento de imágenes

Collab con Scikit

Algoritmos más usados en Machine Learning

Bonus: Redes neuronales y herramientas

Cierre

27
Conclusiones y siguientes pasos
03:32 min

Tomar examen

Comentarios

Gabriel Escribá

student•

Se que quizás sonará rudo, pero siento que estos nueve minutos están infinitamente mejor explicados que prácticamente, desde la sección 2 a la 5 completa, Ricardo sin duda es un profesor que se pone en el supuesto de que si bien, no somos totalmente ignorantes en el tema, aún no manejamos un vocabulario lo suficientemente técnico cómo para avanzar tan rápido cómo lo hace el, a mi parecer, o bien Ricardo da el curso completo, o es Ricardo quién debió haber hecho las secciones iniciales.

Aún así no quiero desmerecer el trabajo de nuestro profesor anterior, todos los profesores de Platzi se esfuerzan por darnos la mejor educación posible, sólo que a veces, no encaja en todas las formas de aprender

Usuario anónimo

user•

Completamente de acuerdo, las primeras sesiones desaniman mucho.

Alberto Sánchez

student•

Justo iba a poner esto de comentario en la clase anterior, tengo experiencia previa en este mundillo y de verdad que se me hizo increiblemente denso y liosas las clases de pytorch. Ojo no digo que sea un mal profesor, solo que Ricardo parece que esta a otro nivel encuanto a docencia se refiere.

JUAN SILVA

student•

volvi a la vida con este profe

Angel Armando Martínez Blanco

student•

Estaba a punto de rendirme hasta que llegó San Ricardo

Sergio Rubiano

student•

De esta forma tambien pueden sacar una submuestra en un data set, donde frac significa el porcentaje que le queremos pasar, y random_state le estamos diciendo que no queremos que nuestros datos vayan hacer aleatorios cada vez que corramos nuestro codigo.

train= df.sample(frac = 0.8, random_state = 1)

Juan Pablo Gomez Hernandez

student•

Excelente quizás deba ir primero esta parte del curso. Todos entramos muy emocionados impacientes por aprender y Adrian ya tiene demasiado conocimiento y pasa por alto muchas cosas.

Francisco Saldarriaga Lema

student•

https://riptutorial.com/es/scikit-learn/example/6801/conjunto-de-datos-de-muestra

el link a otros datasets, puesto al comienzo del video

Usuario anónimo

user•

Estaba super perdido pero ahora siento que he vuelto al camino del aprendizaje Muchas Gracias por la explicacion

Marcela Dueñas

student•

Por que el curso no empezo por aca?

Erik Elyager

student•

¡Hola!, Tratamos de estructurar los cursos de una forma que sea entendible para todos, cuéntanos ¿Por qué crees que el curso debería haber empezado en esta clase? nos encantaría escuchar tu feedback. 🙂

Steven Guzman Angulo

student•

Debido a que en el otro curso una gran mayoría de estudiantes estuvimos completamente perdidos y sentimos no haber entendido.

Carli Code

teacher•

Adoré esta explicación! recién se me están aclarando dudas que tenía desde primeros videos

Rodrigo Urquizo Yepez

student•

Olvidense de pytorch, comiencen desde aca, para usar Pytorch se necesita un conocimiento mas denso que lo encontraran con la teoria, la investigacion y mucha paciencia.Creo que cometieron un error al poner algo avanzado al inicio. Por cierto este profe deberia enseñar toda la carrera, se aprende bastante.

Andrés Ernesto Gómez

student•

Considero lo mismo que menciona @Miauchis, esta seríe de clases, desde la No 18, considero que se explica mejor temás y de forma más sencilla, mientras que las anteriores se siente como si fueran temás más complejos y se aplican funciones que sabemos que están entrenando los modelos pero no es claro realmente como cada algoritmo hace su trabajo.

MARITZA MILENA SERRANO BARRERO

student•

Excelente profesor!!!!!

Luis Chavez

student•

Muuuucho más claro esta parte de scikit

Ariadna B

student•

Bastante más didáctico. En muchos otros cursos de ML, siempre se inicia con código puro sin frameworks, después se escala a Scikit learn, para continuar con Keras. Pytorch y TensorFlow son ya temas más avanzados, muy especializado en donde ya tienes un background ya consolidado.

Juan Sebastián Gómez Moreno

student•

Pero por qué no empezamos por aquí? vengo 17 clases sufriendo eternamente, para saber que todo pudo ser más sencillo de entender si empezábamos por acá y luego seguíamos con Pytorch

Mauricio Gomez

student•

Que bien explica Ricardo

Alejandro Briones

student•

El curso resumido en un video

Arturo Baduna

student•

el otro era re malo seguro q agregaron esta parte

Rodrigo Urquizo Yepez

student•

Es que para usar Pytorch ya tienes que tener los principios y las bases al pie de la letra.Por eso no se entendia asi nomas con la explicacion, pienso que eso debe estar ya al final de los cursos.

Usuario anónimo

user•

¿ En la distribución de datos de entrenamiento y prueba que criterios se usan para tomar los porcentajes de asignación?

Usuario anónimo

user•

Hola! Donde puedo encontrar el code? no se encuentra en los archivos y enlaces

Usuario anónimo

user•

estos son todos mis apuntes de este curso, los cuales contienen todo los códigos y archivos utilizados durante el curso Codes ML on Github

Usuario anónimo

user•

Te comparto el código completo de esta sesión de clase:

iris = load_iris() # Se carga el data set en la varible que los almacenara

df = pd.DataFrame(iris.data, columns=iris.feature_names) # Se crea y define el Data Frame a partir de los datos cargados definiendo sus features

df.head() # Se visualizan los 5 primeros registros del Data Frame creado y definido.

df['species'] = pd.Categorical.from_codes(iris.target, iris.target_names) # Se añade al Data Frame la columna que falta con las especies de flores

df.head() # Se visualizan nuevamente los 5 primeros registros del Data Frame

trainRandom = np.random.rand(len(df)) &lt; 0.8 # Se seleccionan aleatoriamente del Data Frame el 80% de los datos para entrenamiento

train = df[trainRandom] # Se almacenan en una variable aparte los datos seleccionados para entrenamiento
train # Visualisa el set de entrenamiento

len(train) # Se averigua el total de datos de entrenamiento

test = df[~trainRandom] # Se almaacena en otra variable el resto de datos para pruebas (20% de los datos)
test # Se muestran los datos de prueba

len(test) # Se averigua el total de datos para las pruebas

print('Number of observations in the training set:', len(train)) # Se imprime el numero de observaciones en el set de entrenamiento
print('Number of observations in the test set:', len(test)) # Se imprime el numero de observaciones en el set de prueba

Claudio Pedalino

student•

embelleciendo el print final:

print('Numero de observaciones en el set de entrenamiento = {}'.format(len(train)))
print('Numero de observaciones en el set de prueba = {}'.format(len(test)))

Eli Yiram Sánchez

student•

OTRA FORMA DE HACERLO

print(f'Numero de observaciones en el set de entrenamiento = {len(train)} ')
print(f'Numero de observaciones en el set de prueba = {len(test)} ')```

iris = load_iris() # Se carga el data set en la varible que los almacenara

df = pd.DataFrame(iris.data, columns=iris.feature_names) # Se crea y define el Data Frame a partir de los datos cargados definiendo sus features

df.head() # Se visualizan los 5 primeros registros del Data Frame creado y definido.

df['species'] = pd.Categorical.from_codes(iris.target, iris.target_names) # Se añade al Data Frame la columna que falta con las especies de flores

df.head() # Se visualizan nuevamente los 5 primeros registros del Data Frame

trainRandom = np.random.rand(len(df)) &lt; 0.8 # Se seleccionan aleatoriamente del Data Frame el 80% de los datos para entrenamiento

train = df[trainRandom] # Se almacenan en una variable aparte los datos seleccionados para entrenamiento
train # Visualisa el set de entrenamiento

len(train) # Se averigua el total de datos de entrenamiento

test = df[~trainRandom] # Se almaacena en otra variable el resto de datos para pruebas (20% de los datos)
test # Se muestran los datos de prueba

len(test) # Se averigua el total de datos para las pruebas

print('Number of observations in the training set:', len(train)) # Se imprime el numero de observaciones en el set de entrenamiento
print('Number of observations in the test set:', len(test)) # Se imprime el numero de observaciones en el set de prueba

Demo con Scikit: división de datos

Conceptos básicos de Machine Learning

Bienvenida Curso de Introducción a Machine Learning

Introducción a la terminología de Machine Learning

Terminología y regresión lineal

Trabajando con Pytorch

Introducción a Pytorch, trabajar con tensores y representar datasets con tensores

Trabajando con tensores

Representando datasets con tensores

Implementaciones de algoritmos de Machine Learning en Pytorch

Implementación de regresión lineal en Pytorch, Regresión logística, Implementación de regresión logística en Pytorch

Regresión logística

Implementación de regresión logística en Pytorch

Redes Neurales y reconocimiento de imágenes

Cómo funciona el reconocimiento facial

Neuronas y función de activación, Usando un modelo pre entrenado para reconocimiento de imágenes, Trabajando un dataset

Usando un modelo pre entrenado para reconocimiento de imágenes

Trabajando un dataset

Reconocimiento de imágenes

Construyendo un modelo, Implementando un clasificador totalmente conectado, Mejoras, limitaciones y conclusiones

Training and Loss: entrenando y ajustando nuestro modelo

Implementando un clasificador totalmente conectado

Mejoras, limitaciones y conclusiones

Collab con Scikit

Aprende a usar Collab con scikit