Contenido del curso
Decisiones Basadas en Datos
Retos
Interpretación de Resultados
Decisiones basadas en datos
Errores estadísticos al interpretar datos de usuarios
Resumen
Cuando una empresa toma decisiones basadas en datos, los errores estadísticos pueden costarle credibilidad, dinero y la confianza de sus usuarios. Aquí vas a entender los cuatro errores más frecuentes al interpretar datos de comportamiento, con ejemplos reales del análisis de salud mental en la app Sanamente, para que evites conclusiones apresuradas en tu propio producto.
¿Qué son los valores atípicos y cómo debes tratarlos?
Los valores atípicos, también llamados outliers, son puntos que se escapan del comportamiento promedio de tus usuarios. No siempre indican un problema, pero tampoco se deben ignorar sin pensarlo dos veces.
En Sanamente, por ejemplo, el promedio de sueño se ubica entre seis y nueve horas. Si alguien duerme 14 horas o solo cuatro, ese dato se sale de la norma. La pregunta correcta no es ¿hay un outlier?, sino ¿es esporádico o es un patrón?
- Si alguien durmió cuatro horas porque tenía un vuelo temprano, es un dato aislado que probablemente debas descartar.
- Si esa misma persona duerme cuatro horas durante una o dos semanas seguidas, ahí sí hay un cambio de comportamiento que merece análisis.
- Si el dato es tan extremo que distorsiona toda tu media, lo más sano es excluirlo del análisis general.
¿Qué es un outlier en análisis de datos? Es un valor que se aleja significativamente del promedio del grupo. Puede ser ruido puntual o una señal de cambio real, según se repita o no.
¿Por qué la sobreinterpretación de datos lleva a malas decisiones?
La sobreinterpretación ocurre cuando das por hecho una conclusión sin suficientes pruebas. Es uno de los errores más caros porque suena lógico, pero se basa en una sola variable.
Imagina a un usuario con un índice de estrés del 80%, cuando el rango saludable está por debajo del 60%. Antes de etiquetarlo con un trastorno de ansiedad, conviene preguntarte: ¿es un momento puntual de carga laboral?, ¿se trata de alguien en un equipo directivo con tolerancia al estrés alta y constante?
Un dato elevado no equivale a un diagnóstico. Equivale a una hipótesis que necesita más variables para confirmarse.
¿Cómo evitas la falta de contexto al interpretar datos?
El contexto es lo que separa un dato útil de una conclusión equivocada. En Sanamente se analizan conversaciones, ruidos, movimiento y actividad en redes sociales. Si una persona empieza a tener cortes de sueño y se duerme llorando, hay una señal fuerte, pero todavía falta el por qué.
Quizá esa persona está pasando por un divorcio. Conocer ese contexto cambia por completo el tipo de acompañamiento, los consejos y el enfoque de atención que se le ofrece. Sin contexto, tu análisis es solo una foto sin historia detrás.
¿Por qué el contexto importa más que el dato aislado? Porque dos personas con el mismo síntoma pueden estar viviendo causas distintas. El contexto te permite personalizar la respuesta y no aplicar una receta genérica.
¿Cómo pensar en términos relativos y no absolutistas?
Los datos internos de tu producto son una parte de la realidad, no toda la realidad. Si tu aplicación no tiene los registros médicos del usuario, no puedes afirmar con certeza que tiene un trastorno.
Pensar en términos relativos significa tratar tus hallazgos como indicios, no como veredictos. Antes de comunicar una conclusión fuerte, conviene cruzar fuentes y, en casos sensibles como salud, validar con un equipo médico especializado.
- Tus datos internos te dan señales tempranas.
- Las fuentes externas (médicas, autoreporte, contexto vital) las confirman o las descartan.
- La decisión final nunca debería apoyarse en una sola fuente.
¿Qué variables analizar antes de concluir un trastorno mental?
Este es un ejercicio práctico que vale la pena resolver. Imagina un usuario con un año en Sanamente que en el último mes pasó de dormir siete horas a seis, y que ahora se conecta a redes sociales una hora antes de acostarse.
Antes de concluir que tiene un trastorno mental, conviene revisar variables como:
- Contenido en redes sociales: qué tipo de publicaciones está viendo, qué comparte, con qué cuentas interactúa.
- Tono de sus conversaciones: si hay cambios en el lenguaje, palabras asociadas a tristeza o ansiedad.
- Actividad física y movimiento: si su rutina diaria se redujo o se volvió errática.
- Eventos vitales recientes: cambios laborales, rupturas, mudanzas u otros disparadores externos.
- Historial previo del propio usuario: cómo se comparan estos datos con su línea base de los últimos meses.
La diferencia entre un análisis pobre y uno robusto está en cuántas variables sabes integrar antes de hablar. ¿Qué otras variables agregarías tú al análisis? Cuéntame en los comentarios cómo lo abordarías.