¿Porque igualamos a 42 el random_state al dividir los datos?

Pregunta de la clase:
Proyecto: Trabajando con datos
Ruben Eduardo Acosta Vela

Ruben Eduardo Acosta Vela

Pregunta
studenthace 6 años

¿Porque igualamos a 42 el random_state al dividir los datos?

2 respuestas
para escribir tu comentario
    Miguel Celis

    Miguel Celis

    studenthace 6 años

    El random_state=42 es un número fijo que utilizan comunmente en documentación y temas de pruebas para obtener simpre la misma salida o resultado. Sin embargo el número real fijo puede ser cualquiera: 0, 15, 3…

    La recomendación es utilizar el random_state con números fijos solo para temas de pruebas, pero en producción debemos omitir su uso ya que así obtenemos un resultado diferente en cada ejecución y es lo que deseamos.

    Fuente

    Jonathan Jair Díaz Pérez

    Jonathan Jair Díaz Pérez

    studenthace 6 años

    De acuerdo a algunas referencias que he leído, entiendo que puede ser cualquier número, solo que es muy común colocar random_state=42.

    Si el random_state es diferente a none esto quiere decir que por cada ejecución del algoritmo se generaran nuevos valores aleatorios y los conjuntos de datos de entrenamiento y pruebas serán diferentes, pero si es un número entero y fijo significara todo lo contrario, es decir que todos los datos se dividirán en un orden permanente y el set de datos de entrenamiento y pruebas serán siempre iguales.

    Links:

    https://stackoverflow.com/questions/42191717/python-random-state-in-splitting-dataset/42197534

    https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html

Curso de Introducción a Machine Learning 2018

Curso de Introducción a Machine Learning 2018

¡Descubre nuevas formas de ver el mundo! No importa el campo que quieras impactar: con machine learning puedes aportar soluciones en medicina, tecnología, sociedad, astronomía o comunicación. Piensa en grande, deja huella e impacta con grandes ideas que hacen la vida más fácil. Aprende machine learning y sé parte del cambio con Platzi.

Curso de Introducción a Machine Learning 2018
Curso de Introducción a Machine Learning 2018

Curso de Introducción a Machine Learning 2018

¡Descubre nuevas formas de ver el mundo! No importa el campo que quieras impactar: con machine learning puedes aportar soluciones en medicina, tecnología, sociedad, astronomía o comunicación. Piensa en grande, deja huella e impacta con grandes ideas que hacen la vida más fácil. Aprende machine learning y sé parte del cambio con Platzi.