Cálculo de duración y MDE en tests A/B
Clase 7 de 14 • Curso de A/B Testing en Productos Digitales
Contenido del curso
Análisis Pre-Test
Configura y lanza tu experimento
Análisis Post-Test
Diseñar experimentos sólidos exige claridad en la métrica principal, entender el tráfico expuesto y calcular el tiempo de ejecución con un efecto mínimo detectable realista. Aquí se explica, paso a paso, cómo estimar duración y MDE con poder estadístico de 80% y significancia de 95%, usando datos concretos sin suposiciones externas.
Duración y efecto mínimo detectable: cómo decidir con datos reales
Para estimar cuánto debe correr una prueba y qué cambio mínimo distinguir del azar, se parte de la métrica principal, el tamaño de muestra expuesta y las tasas actuales de conversión. Así, el MDE te indica la diferencia necesaria entre control y variación para separar la señal del ruido.
¿Cómo usar el análisis pretest con poder estadístico y significancia?
- Mantén valores estándar: poder estadístico 80% y significancia 95%.
- Define el canal y el lugar del cambio: página de inicio y checkout.
- Fija la métrica principal: clic en añadir al carrito.
- Usa promedios recientes para estimar muestra y conversiones.
¿Qué es el efecto mínimo detectable y por qué importa?
- Es la diferencia mínima entre variación y control que puedes detectar con confianza.
- Sirve para planear duración: más tiempo, menor MDE; menos tiempo, mayor MDE.
- Ejemplo con histórico de tráfico:
- 3 semanas: MDE ≈ 7.02%.
- 6 semanas: MDE ≈ 4.94%.
- Recomendación práctica: buscar MDE < 5% cuando sea razonable influir el comportamiento.
- Nota: los promedios recientes pueden cambiar; úsalo como marco de decisión, no como garantía.
Tráfico, muestra y conversiones: qué incluir y qué excluir
El tamaño de muestra debe contar solo a quienes ven el tratamiento. Incluir usuarios no expuestos sesga los cálculos y subestima el MDE.
¿A quién contar como tráfico expuesto al tratamiento?
- Excluye usuarios de secciones fuera del experimento: por ejemplo, blog si no se prueba allí.
- Si nadie llega a checkout sin pasar por inicio, usa la página de inicio como referencia.
- Datos base del ejemplo: 19,800 usuarios semanales en inicio (últimas seis semanas).
¿Qué métricas principales y secundarias considerar?
- Métrica principal: adiciones al carrito.
- Conversiones semanales para el cálculo: 1,600 usuarios añaden al carrito.
- Métricas secundarias (p. ej., transacciones) pueden calcularse, pero elevan la dificultad para detectar efecto.
- Decisión de negocio: prioriza la métrica con mayor sensibilidad al cambio propuesto.
Duración ideal de pruebas y adaptaciones a email marketing
La duración debe respetar los ciclos de negocio semanales y el contexto del canal. En web, evita cortar antes de ver patrones completos; en email marketing, todo sucede en una sola ola.
¿Cuántas semanas correr la prueba A/B en sitio?
- Mínimo: 1 semana para cubrir el ciclo completo.
- Ideal: 2 semanas si alcanzas el MDE planificado.
- Máximo: 6 semanas para evitar efectos que ensucien datos y por practicidad.
- Evita iniciar lunes y cerrar jueves: perderías el patrón del fin de semana.
- Si planeas 4–6 semanas: espera al final para concluir con significancia.
¿Cómo cambia el MDE en email marketing según el objetivo?
- Si pruebas asunto del correo: todo ocurre en la semana 1.
- Con tus volúmenes esperados, el MDE de la reacción al asunto sería ≈ 12.3%.
- Si pruebas un llamado a la acción en el cuerpo:
- Tráfico pasa a ser quienes abren: 1,600.
- Conversiones históricas de clic en llamado a la acción: 280.
- El MDE sube de forma radical: alrededor de 30%.
¿Cómo interpretar MDE altos para cambios de UI?
- Un MDE cercano al 30% exige un cambio muy grande en comportamiento.
- Señal de alerta: pruebas como botón rojo vs verde probablemente no aporten valor.
- Usa el MDE como filtro para priorizar hipótesis con potencial real de impacto.
¿Ya ajustaste tu plan de experimento con duración y MDE? Compártelo en comentarios y cuéntanos tus valores y decisiones clave.