Gobernanza de datos: del caos al insight

Clase 5 de 22Curso de Visualización de Datos para BI

Resumen

Los datos solo generan valor cuando se gestionan con gobernanza de datos, estandarización y repositorios confiables. Aquí verás cómo evitar capturas erróneas, elegir dónde almacenar y asegurar accesos, para avanzar en la madurez de los datos y tomar decisiones basadas en insight, no en opiniones.

¿Qué es la gobernanza de datos y por qué importa?

La gobernanza define políticas, estandarizaciones y procedimientos para que la información tenga validez y madurez dentro de la organización. Incluye cómo capturar y escribir los datos, qué formatos usar, dónde guardarlos y cómo administrarlos.

  • Definir políticas de captura y escritura: criterios claros y únicos.
  • Estandarizar formatos: fecha, hora 24 horas, hora local o internacional, y hora epoch.
  • Administrar el ciclo de vida: dónde se guardan y cómo se mantienen.

¿Qué errores provoca la falta de estandarización?

  • Fechas incoherentes: “junio”, “jul” o “06” para el mismo campo.
  • Horas con criterios distintos: 24 horas, hora local, internacional o epoch.
  • Pérdida y dispersión de información por no definir mecanismos de captura.

¿Qué habilidades se ponen en práctica?

  • Diseño de políticas y procedimientos de gobernanza.
  • Documentación de estándares de formato y captura.
  • Controles de calidad para validar coherencia y consistencia.

¿Dónde y cómo almacenar y acceder a los datos en la nube?

No es viable seguir guardando en el computador personal o en el equipo de la secretaría. Se debe seleccionar un repositorio según el tipo y la calidad de los datos, privilegiando tecnologías en la nube como OneDrive, SharePoint o un lago de datos.

  • Evitar equipos personales: centralizar y proteger la información.
  • Seleccionar repositorio según “datos estructurados” o “datos semiestructurados”.
  • Acceder desde la nube o carpetas locales con métodos definidos.
  • Autenticación por origen: SQL, NoSQL o SharePoint.
  • Disponibilidad “veinticuatro siete” con los permisos adecuados.

¿Qué diferencia hay entre datos estructurados y semiestructurados?

  • Estructurados: similares a tablas de Excel.
  • Semiestructurados: más flexibles en su forma y atributos.

¿Qué decisiones operativas implica el acceso?

  • Establecer métodos de obtención y autenticación para cada fuente.
  • Alinear permisos con las políticas de gobernanza.

¿Cómo avanzar en la madurez de los datos hacia decisiones con insight?

La madurez de los datos progresa por etapas, cada una con acciones claras para pasar del reconocimiento de fuentes a estrategias y escenarios futuros.

  • Exploratoria: hay datos, pero no se sabe dónde están ni qué hacer con ellos; se realiza una lectura preliminar y aún no hay camino definido.
  • Asimilación: usuarios interactúan con datos internos y externos para mejorar producto y visibilidad del valor.
  • Liderar con los datos: se interpretan con perspectiva futura y se usan para crear estrategias.
  • Liderazgo: decisiones más efectivas y acertadas con datos reales, estudiando el pasado para proyectar el futuro.
  • Innovación: diseño de escenarios hipotéticos a partir de procedimientos maduros; por ejemplo, campañas de mercadeo basadas en datos.

¿Qué habilidades desarrollas en cada etapa?

  • Identificar y ubicar fuentes para una lectura preliminar.
  • Integrar datos internos con externos para mayor valor.
  • Analizar con enfoque futuro para definir estrategias.
  • Operar con permisos y procedimientos establecidos.
  • Proponer escenarios y acciones basadas en evidencia.

La madurez de los datos marca la diferencia entre insight y opiniones.

¿Tu organización ya tiene una estrategia de gobernanza de datos? Comparte en los comentarios qué prácticas aplican o cuál propondrías implementar.