Análisis Cuantitativo para Identificar Clientes Conflictivos

Clase 16 de 23Curso de Análisis de Negocios para Ciencia de Datos

Contenido del curso

El mundo de los datos: data science y machine learning

Problema de negocio: análisis

Resumen

Encontrar a los clientes que generan un volumen desproporcionado de quejas sin aportar rentabilidad equivalente es uno de los retos más valiosos en cualquier operación de soporte. Aquí se aplica la primera fase de la metodología storytelling con datos: el análisis cuantitativo, que permite transformar números crudos en decisiones estratégicas con alto impacto y mínimo riesgo.

¿Cómo se estructura un análisis cuantitativo de quejas?

El punto de partida es sencillo: medir todo y después filtrar lo relevante [0:18]. Se descarga la información mediante SQL de la forma más genérica posible, trayendo a cualquier cliente que haya contactado al equipo de soporte al menos una vez durante el mes. Si un cliente nunca escribió, en ningún escenario será un top offender, así que se excluye desde el inicio.

Para que el proceso sea replicable, se crean macros o variables adaptables por ciudad y por mes [1:20]. Basta con cambiar el nombre de la ciudad o el número de mes para obtener resultados actualizados sin reescribir el código.

¿Qué variables definen a un top offender?

Una vez descargada la data, se formulan hipótesis sobre qué factores influyen en el comportamiento de queja. Las variables propuestas son:

  • Madurez: número total de compras históricas. Un usuario nuevo no conoce la plataforma y tiende a generar más dudas que alguien con cien compras [1:50].
  • Quejas mensuales: no es igual una queja que cien en el mismo periodo [2:18].
  • Compras mensuales: sirven como denominador para construir ratios en lugar de juzgar cifras absolutas [2:25].
  • Gasto mensual: un producto de dos mil dólares es más complejo que uno de veinte; el volumen de gasto contextualiza las quejas [2:55].
  • Créditos y dinero devuelto: revelan si el cliente busca sistemáticamente una compensación económica [3:15].
  • Margen operativo neto: fórmula que integra todo —unidades vendidas por precio, menos costo de atender mensajes, menos devoluciones— para saber cuánto queda realmente a la empresa [3:30].

El objetivo es segmentar en función de la rentabilidad: a mayor rentabilidad del cliente, mayor tolerancia a sus quejas.

¿Cómo se clasifican los clientes por categoría?

Se establecen cuatro niveles según compras mensuales [4:22]:

  • Regular: nueve compras o menos.
  • Bronce: entre diez y diecinueve.
  • Plata: entre veinte y treinta y nueve.
  • Oro: cuarenta o más, al menos una o dos compras diarias.

El mapeo inicial arroja doscientos ochenta mil regulares, cincuenta y seis mil bronces, diecisiete mil plata y seis mil oro, todos con al menos una queja [4:52]. Para entender qué es normal, se compara contra el universo completo de seis millones de usuarios activos.

¿Por qué la ratio de contacto es más útil que el número absoluto de quejas?

La ratio de contacto divide quejas entre compras [5:50]. Un cliente regular se queja el 43 % de las veces, mientras que un oro apenas el 4 %. Si se bloqueara a quien más se queja en términos absolutos, se castigaría a los oro —los más rentables—, que con dos quejas sobre cincuenta y dos compras tienen todo el derecho a reclamar.

Un gráfico de densidad confirma la hipótesis de madurez [6:10]: los usuarios con más de diez compras se concentran cerca de cero en el eje de ratio de contacto, mientras los nuevos se sesgan hacia la derecha. Los usuarios nuevos no deben considerarse top offenders; simplemente no entienden la plataforma. Al excluirlos, la ratio de los regulares baja del 43 % al 12 % [7:10].

¿Dónde se traza el límite entre queja normal y queja excesiva?

El threshold o límite busca impactar al mínimo número de personas y afectar el máximo volumen de quejas [7:35]:

  • Regulares: el 20 % de usuarios explica el 35 % de sus quejas.
  • Bronce: apenas el 5 % explica el 17 % de los tickets.
  • Plata y oro: con solo el 1 %, se cubre el 7 %.

El resultado final: 43 250 clientes top offenders sobre seis millones de usuarios, que explican el 20 % del total de quejas de la empresa [8:15]. Pocos usuarios, impacto enorme.

Antes de avanzar al análisis cualitativo, vale la pena reflexionar: ¿cómo sería tu propia clasificación numérica? ¿Qué hipótesis formularías y qué variables elegirías? Comparte tu enfoque en los comentarios.