Resumen

Entender por qué un cliente abandona un servicio es una de las preguntas más valiosas para cualquier negocio. Con un dataset de telecomunicaciones y la capacidad analítica de ChatGPT, es posible identificar las variables que más influyen en la deserción sin necesidad de escribir código complejo ni dominar estadística avanzada.

¿Qué es el churn y por qué importa analizarlo?

El churn es el término que describe la acción de un cliente cuando se da de baja o deja de utilizar un servicio [0:06]. Puede ocurrir en cualquier industria: una suscripción que no se renueva, un plan telefónico que se cancela o un contrato que no se extiende.

En el dataset utilizado se cuenta con 5986 registros y 22 columnas [2:14] que incluyen variables demográficas como género, si la persona es ciudadano mayor o si tiene dependientes. También aparecen variables del servicio: tipo de contrato, método de pago, cargos mensuales, cargos totales y, por supuesto, la columna más relevante: si el cliente hizo churn o no.

¿Cómo preparar el dataset antes de analizar?

Al cargar el archivo CSV en ChatGPT, la herramienta detectó automáticamente varios puntos de limpieza [2:42]:

  • Una columna sin título que podría generar ruido y conviene eliminar.
  • La columna total charge, que debería ser numérica, aparecía como categórica por contener datos en texto.
  • Variables categóricas que requieren tratamiento antes de alimentar modelos más avanzados.

Cuando se solicitó convertir total charge a numérico, ChatGPT encontró 10 valores nulos [7:14]. La solución aplicada fue reemplazarlos con la mediana, una estrategia válida cuando la cantidad de datos faltantes es mínima frente al total de registros.

¿Qué variables categóricas se relacionan con la deserción?

El análisis de variables categóricas frente al churn reveló patrones claros [5:10]:

  • Género: la distribución de deserción es prácticamente idéntica entre hombres y mujeres, lo que indica que el género no influye en la decisión de abandonar el servicio.
  • Tipo de contrato: los contratos mes a mes presentan una tasa de churn significativamente más alta comparada con contratos anuales o de dos años [5:36]. Esto tiene lógica: si un cliente puede cancelar cada mes, la barrera de salida es mínima.
  • Facturación electrónica: quienes usan paperless billing tienden a desertar más [6:16].
  • Servicios de ciberseguridad: las personas que no cuentan con seguridad en línea muestran una tasa de churn más elevada [5:22].

¿Qué revelan las variables numéricas sobre el churn?

Tres variables numéricas fueron evaluadas: la antigüedad del cliente (tenure), los cargos mensuales (monthly charges) y los cargos totales (total charges) [7:52].

  • Antigüedad: a mayor tiempo en la compañía, menor probabilidad de deserción. Los clientes nuevos son los más vulnerables.
  • Cargos mensuales: a mayor costo del servicio mensual, más alta es la probabilidad de churn. Los clientes que pagan más buscan alternativas con mayor facilidad.
  • Cargos totales: no se observó una diferencia significativa entre los grupos que abandonaron y los que permanecieron.

¿Cuáles son las variables más determinantes según el análisis estadístico?

Para obtener un ranking definitivo, ChatGPT aplicó el test chi-cuadrado [9:05], un método estadístico que evalúa la asociación entre variables. El resultado ordenó las variables por su nivel de influencia:

  • Cargos totales y antigüedad encabezan la lista por su impacto significativo.
  • Cargos mensuales y el tipo de contrato les siguen de cerca.
  • Servicios adicionales como seguridad en línea y fibra óptica también pesan en la decisión.
  • Ser ciudadano mayor o tener dependientes son factores complementarios.

ChatGPT también sugirió alternativas más avanzadas como la regresión logística o los árboles de decisión [9:18] para profundizar el análisis, herramientas que la propia plataforma puede ejecutar directamente.

Con este tipo de análisis, cualquier equipo puede identificar qué palancas mover para mejorar la retención: ajustar precios, incentivar contratos a largo plazo o reforzar servicios complementarios. ¿Qué variable empezarías a modificar primero en tu negocio?