Aportes 8

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

![](https://static.platzi.com/media/user_upload/image-74330921-0c37-4400-9040-6f29de963b59.jpg)
### **Resumen del Proceso de Analisis de Datos** 1️⃣ Entender el contexto 📖 2️⃣ Cargar los datos 🗂 3️⃣ Explorar su estructura 🔍 4️⃣ Obtener estadísticas básicas 📊 5️⃣ Manejar valores nulos ❌ 6️⃣ Buscar duplicados 🧐 7️⃣ Detectar outliers 🚨 8️⃣ Analizar correlaciones 🔗 Espero les ayude, porque a mi no me quedaba claro el proceso en lo general de que ir haciendo con cada dataset
La profesora no muestra los resltados de los comandos en la clase, uno se tiene que imaginar lo que ejecuta, deben mejorar mucho esto
En local, con Jupyter Notebooks: No olviden instalar la libreria openpyxl ```js pip install openpyxl ```
Creo que si seria bueno que la profesora hiciera el ejercicio para poder comparar el resultado.
Para la ingesta de datos desde archivos Excel, utilizamos la biblioteca Pandas en Python. La función `pd.read_excel('archivo.xlsx')` permite leer un archivo Excel y cargarlo en un DataFrame. Es posible especificar la hoja deseada en caso de que el archivo contenga múltiples hojas. Además, es crucial explorar la estructura de los datos con métodos como `df.head()` y `df.info()` para identificar posibles problemas antes del análisis. Pandas soporta formatos `.xls` y `.xlsx`, y en caso de incompatibilidad, podrías necesitar librerías como `openpyxl` o `xlrd`.
Hola buenas. Solo una observación, en el minuto 1:14 menciona la manera de leer una hoja específica de excel, sin embargo no se visualiza dicho ejemplo en el código
Super completo el Notebook! gracias por este recurso =)
undefined