Validar hipótesis de rotación con IA y Excel

Resumen

¿Tu gerente cree que la distancia al trabajo está disparando la rotación de personal? Antes de cambiar tu política de contratación, vale la pena validar esa hipótesis con datos reales usando Excel e inteligencia artificial. Aquí verás cómo hacerlo paso a paso, incluso si tu base tiene 100 registros o más.

Por qué validar una hipótesis antes de tomar decisiones de RR. HH.

Una hipótesis sin datos es solo una intuición. En este caso, el gerente sugiere contratar personas que vivan cerca de la oficina porque cree que las que viven lejos abandonan más rápido la organización. Suena lógico, pero antes de filtrar candidatos por código postal, necesitas evidencia.

La base de datos disponible incluye la dirección de cada colaborador, su edad y su antigüedad. Con esos campos puedes construir una variable nueva: la distancia entre la casa y el lugar de trabajo, medida en kilómetros. Esa será tu variable explicativa.

¿Qué es validar una hipótesis en análisis de datos? Es contrastar una suposición de negocio con evidencia numérica para decidir si la mantienes, la ajustas o la descartas. No prueba causalidad, pero sí orienta la decisión.

Cómo calcular distancias masivas con ChatGPT en minutos

Calcular la distancia entre dos direcciones es fácil en cualquier buscador de mapas. El problema aparece cuando tienes 100 colaboradores y necesitas hacerlo uno por uno. Ahí entra la IA como acelerador de productividad [02:30].

Una primera prueba útil es lanzar un prompt sencillo en ChatGPT pidiendo la distancia en kilómetros entre dos direcciones de Bogotá, Colombia. La respuesta no solo entrega los kilómetros aproximados, también suma información extra como el tiempo a pie o en transporte público.

El segundo paso es escalar. Con un nuevo prompt le pides que calcule la misma distancia hacia la dirección del trabajo para los 100 registros y que devuelva el resultado en una tabla exportable a Excel. En pocos minutos tienes una columna nueva lista para integrar a tu base consolidada.

Qué precauciones tomar al usar IA con datos de personas

Antes de pegar información en un chat, recuerda dos reglas básicas:

  • No subas datos privados ni identificables de tus colaboradores a herramientas externas.
  • Si necesitas practicar, genera bases sintéticas con un prompt previo, como se hizo en este ejercicio.
  • Documenta el prompt usado para que el cálculo sea replicable por tu equipo.

Cómo interpretar un gráfico de dispersión y un coeficiente de correlación

Con la nueva columna distancia al trabajo y la columna antigüedad, ya tienes dos variables cuantitativas listas para cruzar. La forma más rápida de explorar su relación es un gráfico de dispersión [05:40], que ubica cada colaborador como un punto en el plano.

En el eje Y va la antigüedad y en el eje X la distancia en kilómetros. Si los puntos forman una nube sin patrón claro, la relación entre ambas variables es débil. Si formaran una línea descendente, sí podrías sospechar que a mayor distancia, menor permanencia.

Para pasar de la intuición visual a un número, Excel ofrece el análisis de correlación dentro del menú Datos, Análisis de datos. Si esa opción no aparece, debes habilitarla desde Archivo, Opciones, en los complementos de Excel.

¿Qué significa un coeficiente de correlación? Es un número entre -1 y 1 que mide el grado de asociación entre dos variables. Cerca de 0 indica que no hay relación lineal; cerca de 1 o -1, una asociación fuerte.

¿Correlación es lo mismo que causalidad? No. Que dos variables se muevan juntas no prueba que una cause la otra. La correlación es solo una primera pista para seguir explorando.

Qué hacer cuando la hipótesis no se sostiene

Si el gráfico muestra puntos dispersos y el coeficiente de correlación es cercano a cero, puedes concluir que la distancia al trabajo no explica la antigüedad de las personas en la compañía. Eso es un hallazgo valioso: evita decisiones de contratación basadas en un sesgo del gerente.

El siguiente paso lógico es enriquecer el análisis con otra fuente: la base de datos de personas que ya abandonaron la organización. Repetir el ejercicio con sus direcciones permitirá comparar perfiles y detectar si hay otras variables (salario, área, jefe directo, modalidad de trabajo) que sí estén impulsando la rotación.

Recuerda que conocer la naturaleza de cada variable (numérica, categórica, ordinal) te ayuda a elegir el estadístico correcto. Si tienes dudas, apóyate en alguien con formación en estadística dentro de tu organización antes de presentar conclusiones.

Cuéntame en los comentarios qué hipótesis de tu equipo te gustaría poner a prueba con este mismo método.