
Ruben Eduardo Acosta Vela
Pregunta¿Porque igualamos a 42 el random_state al dividir los datos?

Miguel Celis
El random_state=42 es un número fijo que utilizan comunmente en documentación y temas de pruebas para obtener simpre la misma salida o resultado. Sin embargo el número real fijo puede ser cualquiera: 0, 15, 3…
La recomendación es utilizar el random_state con números fijos solo para temas de pruebas, pero en producción debemos omitir su uso ya que así obtenemos un resultado diferente en cada ejecución y es lo que deseamos.

Jonathan Jair Díaz Pérez
De acuerdo a algunas referencias que he leído, entiendo que puede ser cualquier número, solo que es muy común colocar random_state=42.
Si el random_state es diferente a none esto quiere decir que por cada ejecución del algoritmo se generaran nuevos valores aleatorios y los conjuntos de datos de entrenamiento y pruebas serán diferentes, pero si es un número entero y fijo significara todo lo contrario, es decir que todos los datos se dividirán en un orden permanente y el set de datos de entrenamiento y pruebas serán siempre iguales.
Links:
https://stackoverflow.com/questions/42191717/python-random-state-in-splitting-dataset/42197534
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html