Contenido del curso
Diseño y ejecución de un proyecto inicial
Preparación de datos para el análisis
Análisis inicial de datos
Construcción de una estrategia a largo plazo
Limpieza de datos en Excel para People Analytics
Resumen
Antes de saltar a un dashboard o un modelo, el primer paso real en un proyecto de People Analytics es limpiar tus datos en Excel. Aquí aprendes qué revisar, cómo detectar errores y cómo dejar tu base lista para análisis confiables, sin necesidad de herramientas complejas.
Esto te sirve si trabajas en recursos humanos, lideras un proyecto de analítica de personas o quieres iniciar tu camino con una herramienta accesible antes de escalar a R, Python o Power BI.
¿Qué habilidades necesitas para iniciar en People Analytics?
Antes de tocar una celda, necesitas instalar dos cosas en ti y en tu equipo: conocimiento técnico y trabajo colaborativo.
El análisis de datos es el lenguaje común con otras áreas. Cuando finanzas te hable de un indicador de costo o de retorno de inversión, debes entenderlo y proponer ideas alrededor de esos datos [00:42]. Y como estos proyectos crecen en profundidad, terminarás trabajando con científicos de datos y expertos en estadística, así que la colaboración no es opcional [01:10].
¿Qué herramientas se usan en People Analytics? Excel para empezar, y luego R, Python, SQL, Power BI o Google Sheets con ChatGPT para análisis más profundos [01:40].
¿Qué criterios debes revisar antes de analizar tus datos?
Una base de datos sucia te lleva a conclusiones equivocadas. Por eso conviene pasar por una checklist mínima antes de cualquier análisis [02:15].
- Verificar que no existan registros duplicados, especialmente con el mismo ID o nombre.
- Decidir qué hacer con datos faltantes: eliminarlos o complementarlos.
- Detectar errores tipográficos que generan ruido al filtrar.
- Validar formatos según la naturaleza de cada variable.
- Confirmar que la data sea verídica y exacta para el periodo de corte.
Si vas a analizar todo un año pero solo tienes 10 meses cargados, ese vacío de dos meses es un desafío que debes resolver antes de seguir [03:30].
¿Cómo detectar IDs duplicados con tabla dinámica?
En una base de 100 personas y 16 campos, los duplicados suelen esconderse en los IDs. La forma más rápida de cazarlos es con una tabla dinámica.
Selecciona toda la base con control + shift + flechas, ve a Insertar, Tabla dinámica y crea una nueva hoja. Coloca el ID en filas y, como Excel por defecto suma, da clic derecho en Configuración de campo y cambia a Recuento [05:30]. Aplica un filtro sobre la columna de conteo y verás cuáles aparecen más de una vez.
En el ejemplo aparecen los IDs 11 y 85 duplicados, con nombres, ciudades y áreas distintas. Aquí no hay respuesta automática: tu criterio decide si eliminas, validas con la fuente o ignoras esos registros [06:50].
¿Cómo arreglar formatos de fecha y número en Excel?
Los formatos inconsistentes son uno de los errores más comunes cuando los datos vienen exportados de un sistema. Una columna de fecha de ingreso puede mezclar diagonales y guiones, y una columna numérica puede llegar como texto.
La solución es la misma para ambos casos: selecciona la columna, ve a la pestaña Datos, Texto en columnas y dale Finalizar. Excel homologa todo al formato real [08:00]. Para confirmar, activa el filtro y revisa si la información se organiza por años o por valores numéricos.
En el campo edad, después de aplicar Texto en columnas, fuerza el formato Número desde la pestaña Inicio y elimina los decimales innecesarios. Una edad con decimales distrae más que aporta [09:20].
¿Cómo corregir errores tipográficos y celdas vacías?
En campos de texto como ciudad de origen, los filtros revelan rápido las inconsistencias. Una c extra en el nombre de una ciudad genera dos categorías cuando debería existir solo una.
La corrección manual es directa: copia el valor correcto y pégalo sobre la celda errónea. Verifica con el filtro que el problema desapareció [10:40]. Para celdas vacías, la pregunta no es técnica sino estratégica: ¿necesitas ese dato para tu hipótesis? Si la respuesta es no, sigue adelante. Si es sí, búscalo en la fuente.
¿Qué hago si una columna no es confiable? Elimínala y recalcula desde otra variable verificada. Por ejemplo, calcula la antigüedad desde la fecha de ingreso en lugar de confiar en un campo dañado.
¿Cómo calcular la antigüedad con la función FRAC.AÑO?
Cuando descubres que una columna como antigüedad tiene valores absurdos (alguien que ingresó en 2024 con muchos años de antigüedad), lo más confiable es recalcularla [12:30].
Elimina la columna corrupta y usa la función =FRAC.AÑO(fecha_inicial; fecha_final; base). Para la fecha final, anida la función HOY(), que devuelve la fecha actual automáticamente. Como base, usa el criterio real 365 [14:00]. El resultado es un número decimal como 1.86 años, que puedes redondear a un decimal desde la pestaña Inicio.
Doble clic en la esquina inferior de la celda y la fórmula se extiende a toda la columna. Acabas de reemplazar un campo no confiable con un cálculo verificable.
¿Cómo convertir texto a número masivamente?
Los códigos postales y otros campos con ceros al inicio suelen llegar como texto y Excel los marca con un triángulo verde de alerta. Convertirlos uno por uno toma demasiado tiempo.
La solución es la misma de siempre: selecciona la columna completa, Datos, Texto en columnas, Finalizar [15:50]. Excel resuelve todos los registros de una sola vez. Esta misma técnica funciona para fechas, números y cualquier campo donde el formato esté mal interpretado.
Con la base ya limpia (sin duplicados, con formatos correctos, sin errores tipográficos y con la antigüedad recalculada), recién ahora puedes conversar con tu negocio sobre desafíos reales como rotación. ¿Qué tan ordenadas tienes hoy tus bases de datos de personas? Cuéntame en los comentarios qué error te ha costado más detectar.