Demo con Scikit: división de datos
Clase 19 de 27 • Curso de Introducción a Machine Learning 2019
Contenido del curso
Clase 19 de 27 • Curso de Introducción a Machine Learning 2019
Contenido del curso
Gabriel Escribá
Usuario anónimo
Alberto Sánchez
JUAN SILVA
Angel Armando Martínez Blanco
Sergio Rubiano
Juan Pablo Gomez Hernandez
Francisco Saldarriaga Lema
Usuario anónimo
Marcela Dueñas
Erik Elyager
Steven Guzman Angulo
Carli Code
Rodrigo Urquizo Yepez
Andrés Ernesto Gómez
MARITZA MILENA SERRANO BARRERO
Luis Chavez
Ariadna B
Juan Sebastián Gómez Moreno
Mauricio Gomez
Alejandro Briones
Arturo Baduna
Rodrigo Urquizo Yepez
Usuario anónimo
Usuario anónimo
Usuario anónimo
Usuario anónimo
Claudio Pedalino
Eli Yiram Sánchez
Se que quizás sonará rudo, pero siento que estos nueve minutos están infinitamente mejor explicados que prácticamente, desde la sección 2 a la 5 completa, Ricardo sin duda es un profesor que se pone en el supuesto de que si bien, no somos totalmente ignorantes en el tema, aún no manejamos un vocabulario lo suficientemente técnico cómo para avanzar tan rápido cómo lo hace el, a mi parecer, o bien Ricardo da el curso completo, o es Ricardo quién debió haber hecho las secciones iniciales.
Aún así no quiero desmerecer el trabajo de nuestro profesor anterior, todos los profesores de Platzi se esfuerzan por darnos la mejor educación posible, sólo que a veces, no encaja en todas las formas de aprender
Completamente de acuerdo, las primeras sesiones desaniman mucho.
Justo iba a poner esto de comentario en la clase anterior, tengo experiencia previa en este mundillo y de verdad que se me hizo increiblemente denso y liosas las clases de pytorch. Ojo no digo que sea un mal profesor, solo que Ricardo parece que esta a otro nivel encuanto a docencia se refiere.
volvi a la vida con este profe
Estaba a punto de rendirme hasta que llegó San Ricardo
De esta forma tambien pueden sacar una submuestra en un data set, donde frac significa el porcentaje que le queremos pasar, y random_state le estamos diciendo que no queremos que nuestros datos vayan hacer aleatorios cada vez que corramos nuestro codigo.
train= df.sample(frac = 0.8, random_state = 1)
Excelente quizás deba ir primero esta parte del curso. Todos entramos muy emocionados impacientes por aprender y Adrian ya tiene demasiado conocimiento y pasa por alto muchas cosas.
https://riptutorial.com/es/scikit-learn/example/6801/conjunto-de-datos-de-muestra
el link a otros datasets, puesto al comienzo del video
Estaba super perdido pero ahora siento que he vuelto al camino del aprendizaje Muchas Gracias por la explicacion
Por que el curso no empezo por aca?
¡Hola!, Tratamos de estructurar los cursos de una forma que sea entendible para todos, cuéntanos ¿Por qué crees que el curso debería haber empezado en esta clase? nos encantaría escuchar tu feedback. 🙂
Debido a que en el otro curso una gran mayoría de estudiantes estuvimos completamente perdidos y sentimos no haber entendido.
Adoré esta explicación! recién se me están aclarando dudas que tenía desde primeros videos
Olvidense de pytorch, comiencen desde aca, para usar Pytorch se necesita un conocimiento mas denso que lo encontraran con la teoria, la investigacion y mucha paciencia.Creo que cometieron un error al poner algo avanzado al inicio. Por cierto este profe deberia enseñar toda la carrera, se aprende bastante.
Considero lo mismo que menciona @Miauchis, esta seríe de clases, desde la No 18, considero que se explica mejor temás y de forma más sencilla, mientras que las anteriores se siente como si fueran temás más complejos y se aplican funciones que sabemos que están entrenando los modelos pero no es claro realmente como cada algoritmo hace su trabajo.
Excelente profesor!!!!!
Muuuucho más claro esta parte de scikit
Bastante más didáctico. En muchos otros cursos de ML, siempre se inicia con código puro sin frameworks, después se escala a Scikit learn, para continuar con Keras. Pytorch y TensorFlow son ya temas más avanzados, muy especializado en donde ya tienes un background ya consolidado.
Pero por qué no empezamos por aquí? vengo 17 clases sufriendo eternamente, para saber que todo pudo ser más sencillo de entender si empezábamos por acá y luego seguíamos con Pytorch
Que bien explica Ricardo
El curso resumido en un video
el otro era re malo seguro q agregaron esta parte
Es que para usar Pytorch ya tienes que tener los principios y las bases al pie de la letra.Por eso no se entendia asi nomas con la explicacion, pienso que eso debe estar ya al final de los cursos.
¿ En la distribución de datos de entrenamiento y prueba que criterios se usan para tomar los porcentajes de asignación?
Hola! Donde puedo encontrar el code? no se encuentra en los archivos y enlaces
estos son todos mis apuntes de este curso, los cuales contienen todo los códigos y archivos utilizados durante el curso Codes ML on Github
Te comparto el código completo de esta sesión de clase:
iris = load_iris() # Se carga el data set en la varible que los almacenara df = pd.DataFrame(iris.data, columns=iris.feature_names) # Se crea y define el Data Frame a partir de los datos cargados definiendo sus features df.head() # Se visualizan los 5 primeros registros del Data Frame creado y definido. df['species'] = pd.Categorical.from_codes(iris.target, iris.target_names) # Se añade al Data Frame la columna que falta con las especies de flores df.head() # Se visualizan nuevamente los 5 primeros registros del Data Frame trainRandom = np.random.rand(len(df)) < 0.8 # Se seleccionan aleatoriamente del Data Frame el 80% de los datos para entrenamiento train = df[trainRandom] # Se almacenan en una variable aparte los datos seleccionados para entrenamiento train # Visualisa el set de entrenamiento len(train) # Se averigua el total de datos de entrenamiento test = df[~trainRandom] # Se almaacena en otra variable el resto de datos para pruebas (20% de los datos) test # Se muestran los datos de prueba len(test) # Se averigua el total de datos para las pruebas print('Number of observations in the training set:', len(train)) # Se imprime el numero de observaciones en el set de entrenamiento print('Number of observations in the test set:', len(test)) # Se imprime el numero de observaciones en el set de prueba
embelleciendo el print final:
print('Numero de observaciones en el set de entrenamiento = {}'.format(len(train))) print('Numero de observaciones en el set de prueba = {}'.format(len(test)))
OTRA FORMA DE HACERLO
print(f'Numero de observaciones en el set de entrenamiento = {len(train)} ') print(f'Numero de observaciones en el set de prueba = {len(test)} ')```