You don't have access to this class

Keep learning! Join and start boosting your career

Aprovecha el precio especial y haz tu profesión a prueba de IA

Antes: $249

Currency
$209
Suscríbete

Termina en:

1 Días
19 Hrs
57 Min
52 Seg

Recomendaciones para garantizar la confiabilidad de tu prueba

12/14
Resources

What is Toyman's law and why is it important in digital experimentation?

Digital experimentation is full of challenges and a vital one is discerning between accurate data and data that could be erroneous. This is where Toyman's law comes into play, which holds that the more striking the data, the more likely it is due to error. In the realm of digital experimentation, where we often look for our experiments to elevate business and alter user behavior, it's easy to get caught up in this desire and overlook the importance of data reliability. This concept suggests that no matter how fantastic the initial results seem, care must be taken, as they may not be representative of a future reality. The implications of this law are crucial, as they ensure that business decisions are made based on reliable data, not on those anomalies that may appear momentarily.

What are the common validity risks in A-B Testing?

A-B Testing, a powerful tool for validating assumptions in digital products, is not without risks related to data validity.

How does instrumentation affect validity risks?

One of the most frequent problems stems from instrumentation. Here, errors such as incorrect traffic distribution, misconfiguration of metrics or unavailable conversion events can seriously affect the reliability of the results obtained. Ensuring that data is collected correctly is an important first step in mitigating instrumentation-related risks.

What role does the nature of the business play in validity?

Beyond the technical aspect, certain phenomena related to the nature of the business can also compromise the validity of experiments. For example, novelty and temporality effects. Novelty effects occur when a new element in the product attracts the user's attention abnormally, but this behavior is not sustained in the long term. Temporality-related effects occur when tests are conducted at very specific periods of the year that do not reflect consistent behavior.

How to mitigate risks in A-B Testing data?

Fortunately, there are mechanisms and practices that can help mitigate these risks, ensuring that the data collected is as reliable as possible.

What are guardrail metrics and how do they help?

Guardrail metrics, or safety metrics, are an essential technique that consists of measuring variables not directly related to the experiment. Examples include the number of product returns or the frequency of contact with customer service, to assess the impact of the experiment on unforeseen aspects. This broader view may reveal negative impacts not initially considered.

How do SRM detectors work?

Sample Ratio Mismatch, known as SRM, is another valuable tool in ensuring test validity. This mechanism detects alerts when there is an unbalanced traffic distribution. An optimal experiment, for example, should show 50% of users in the control and 50% in the variant. Significant deviations suggest possible errors in the experiment and should be investigated.

What are the benefits of AA testing?

Implementing AA tests can be key to evaluate the accuracy of the system before launching a real A-B test. In these tests, the setup of a regular test is replicated, but without changes between control and variation. If after a while, the results are nearly identical and without statistical significance, the data are reliable. If not, it indicates that there is an underlying problem that needs to be addressed before moving forward with more complex testing. This step is essential to ensure that the system is working properly and the data we collect is trustworthy.

Contributions 5

Questions 1

Sort by:

Want to see more contributions, questions and answers from the community?

### Riesgos de Experimentación: 1. **Instrumentación:** * **Descripción:** La implementación incorrecta de la instrumentación puede conducir a recopilar datos inexactos o incompletos. * **Mitigación:** Verificar y validar la instrumentación antes de la ejecución del experimento. Realizar pruebas de carga para asegurar la funcionalidad adecuada de la instrumentación. 2. **Confiabilidad:** * **Descripción:** La falta de confiabilidad en los datos puede afectar la interpretación precisa de los resultados. * **Mitigación:** Utilizar redundancia en la instrumentación, verificar la coherencia de los datos entre diferentes fuentes y realizar auditorías periódicas. 3. **Temporalidad:** * **Descripción:** Cambios en el comportamiento del usuario debido a factores temporales externos pueden afectar los resultados del experimento. * **Mitigación:** Considerar la temporalidad en el diseño experimental y, si es posible, ejecutar experimentos en diferentes períodos para evaluar la consistencia de los resultados. ### Mecanismos para Mitigar Riesgos: 1. **Métricas de Seguridad:** * **Descripción:** Medir métricas adicionales, como el número de devoluciones o quejas, para detectar posibles problemas no capturados por las métricas principales. * **Función:** Proporciona una capa adicional de seguridad al monitorear indicadores relacionados con la experiencia del usuario y la satisfacción. 2. **Detectores de SRM (Sample Ratio Mismatch):** * **Descripción:** Identifica desequilibrios en la distribución del tráfico entre las variantes del experimento. * **Función:** Alerta sobre posibles problemas de asignación de tráfico, garantizando una distribución adecuada entre el grupo de control y el grupo de tratamiento. ### Prueba A/A Test: * **Descripción:** Consiste en aplicar la misma configuración de experimento (A/B) pero sin realizar cambios, lo que debería resultar en ninguna significancia estadística. * **Objetivo:** Verificar la estabilidad y validez del proceso de experimentación, asegurándose de que no haya resultados significativos cuando no se han introducido cambios. ### Consideraciones: * La mitigación de riesgos en la experimentación es esencial para obtener resultados confiables y significativos. * Combinar múltiples métricas y mecanismos de detección fortalece la robustez del proceso experimental. * La prueba A/A es una herramienta valiosa para evaluar la consistencia del sistema y la aleatorización en ausencia de cambios sustanciales.

“Entre más llamativos sean los datos observados más probable es que se deban a un error”

Gracias

Riesgo de experimentación:
-Instrumentación
-Confiabilidad.
-Temporalidad.

Mecánismos para mitigar los riesgos:
-Métricas de seguridad: Medir el número de devoluciones o de quejas.
-Detectores de SRM (Sample ratio mismatch): Es un detector que se da, cuando el tráfico no está correctamente distribuido.

  • Prueba A/A test: Generamos la misma configuración que en la prueba A/B, pero no realizamos ningún tipo de modificación, por lo tanto no debería haber significancia estadística.
\> \_\*\*“ Entre más llamativos sean los datos observados más probable es que se deban a un error. ”\*\*\_` `>>Ley de Toyman