Tener una cultura orientada al dato no sirve de nada si los datos que usas son malos. La calidad de datos y su gobernanza son la base para tomar decisiones con confianza, evitar retrabajo y proteger el valor de tu organización. Aquí te explico cómo evaluarla y cómo ordenarla sin caos.
¿Qué significa que un dato sea de calidad?
Un dato confiable cumple con cinco dimensiones que conviene revisar antes de tomar cualquier decisión basada en él.
- Completitud: que no falte información y todos los campos estén llenos cuando deberían estarlo.
- Exactitud: que los datos sean correctos. Si tu dirección dice CDMX pero vives en Guadalajara, ese dato no sirve.
- Actualidad: que estén al día. Información de hace seis meses no ayuda si el mercado ya cambió.
- Consistencia: que un mismo dato no diga una cosa en un sistema y otra distinta en otro.
- No duplicidad: evitar tener tres registros distintos para la misma persona, un clásico que ensucia cualquier base.
Cuando una de estas dimensiones falla, las decisiones se vuelven más lentas, más costosas o directamente equivocadas.
¿Qué es la calidad de datos? Es el grado en que los datos cumplen con cinco dimensiones: completitud, exactitud, actualidad, consistencia y no duplicidad. Si fallan, fallan tus decisiones.
¿Cómo se mantiene la calidad de los datos en una organización?
Aquí entra la gobernanza de datos, que suena elegante pero en el fondo es tener orden y reglas claras: saber quién cuida qué datos, con qué políticas y cómo asegurar que todo fluya sin caos.
¿Qué hace un data steward y qué hace un data owner?
Dos roles sostienen la gobernanza y conviene no confundirlos.
El data steward es quien cuida un conjunto específico de datos. Su trabajo es asegurar que estén bien definidos, que se usen correctamente y que se mantengan limpios en el día a día.
El data owner es el responsable último de esos datos: su valor, sus riesgos y su cumplimiento normativo. Es quien responde si algo sale mal.
Algo importante: estos roles no tienen que estar solo en áreas técnicas. Muchas veces, gente de negocio los asume mejor porque entiende cómo se usan los datos en la vida real.
¿Quién debe ser data steward, alguien técnico o de negocio? Frecuentemente es mejor que sea alguien de negocio, porque conoce el contexto de uso del dato y detecta inconsistencias que un perfil técnico podría pasar por alto.
¿Qué herramientas necesitas para gobernar tus datos?
Para que la gobernanza funcione, necesitas visibilidad. Y la visibilidad se construye con herramientas concretas que te muestran qué tienes y de dónde viene.
- Data catalog: un inventario de todos los activos de datos. Te dice qué datos existen, dónde están, para qué sirven y quién los usa.
- Data lineage: el recorrido de un dato desde su origen hasta su destino final. Es clave para auditar, depurar o entender por qué un dato terminó donde terminó.
Estas herramientas no solo te dan control, también generan confianza. Y cuando hay confianza en los datos, hay mejores decisiones.
¿Cómo aplicar esto a tu trabajo hoy mismo?
Piensa en un informe o proceso importante en tu día a día que dependa mucho de los datos y responde tres preguntas.
- ¿Qué problema de calidad has notado ahí? Por ejemplo, información que siempre llega incompleta o registros que nunca cuadran.
- ¿Cómo impacta eso en el negocio? Puede retrasar decisiones, generar desconfianza u obligarte a retrabajo constante.
- ¿Quién debería ser el data steward o el data owner de ese conjunto de datos?
Este ejercicio no es técnico, es estratégico. Te ayuda a poner orden en un tema que casi nadie quiere tocar, pero que define qué tan lejos puede llegar tu organización con sus datos.
Y cuando empieces a trabajar en serio con datos, va a aparecer una pregunta inevitable: hasta dónde está bien usarlos. Porque no todo lo que se puede hacer con datos se debe hacer. De ética y privacidad hablaremos en la siguiente clase. ¿Cuál es el problema de calidad de datos más recurrente en tu trabajo? Cuéntamelo en los comentarios.