3

¿Como importar datos de Excel a Python? 📊

Para importar datos desde un archivo en Excel a python es un procedimiento muy sencillo. A continuación se resumen los pasos necesarios.

1.- Primero hay que tener un archivo en Excel, con extensión xls o xlsx.

En la siguiente figura se muestra una tabla con 3 columnas y 10 filas (incluyendo la fila de los encabezados).

Esta tabla está en una hoja de Excel de nombre inicial y el archivo se llama inicial.xlsx. Aquí el nombre de la hoja y el nombre del archivo Excel son iguales, pero no tiene que ser así. Las hojas y el archivo pueden tener cualquier nombre.

2.- La librería de pandas debe haber sido previamente importada e instalada.

3.- importar el paquete pandas. Es común utilizar el alias pd para abreviar el nombre del paquete.

import pandas as pd

4.- Leer el archivo Excel utilizando la instrucción que se muestra a continuación.

File = pd.ExcelFile(‘inicial.xlsx’)

File es el nombre de una variable donde vamos a almacenar el archivo Excel, puede ser cualquier nombre que deseemos.

pd.ExcelFile(’inicial.xlsx’) es una función de lectura, el nombre del archivo debe colocarse entre apóstrofos. En este caso se utiliza solamente el nombre del archivo porque lo hemos colocado en la misma ubicación donde tenemos instalado el programa python que estamos ejecutando.

5.- Si queremos saber los nombres de las hojas que tiene el libro de Excel que hemos almacenado en la variable File utilizamos la siguiente instrucción. En este caso solamente hay una hoja con nombre ‘inicial’.

print(File.sheet_names)

[‘inicial’]

6.- Se crea una variable que hemos llamado df y se lee el contenido de la hoja ‘inicial’ utilizando la función parse.

df=File.parse(‘inicial’)

7.- Imprimimos el contenido de la variable df. Se puede notar que las filas están numeradas desde el 0 hasta el 8. En python el primer índice es el 0.

print(df)

  Area       pozo     gasto_Inicial

0 Este          XP-1E                  2301 Oeste        TX-2                    5202Norte        YJ-3                     6003 Este          XP-2                    3004 Oeste       TX-3                    6005Norte       YJ-4                   10006 Este         XP-3                    6007 Oeste      TX-4                    9008Norte     YJ-5                    1500

8.- Podemos utilizar la función describe() para obtener una descripción de las columnas que contienen datos numéricos. Se muestran los valores de numero o cuenta de elementos (count), la media (mean), la desviación estándar (std), el valor mínimo (min), los percentiles 25, 50 y 75 (25%, 50% y 75%), el valor máximo (max)

df.describe()

|================

||gasto_Inicial

|count     |9.000000

|mean     |694.444444

|std          |389.394116

|min        |230.000000

|25%        |520.000000

|50%       |600.000000

|75%       |900.000000

|max      |1500.000000

|================```



Escribe tu comentario
+ 2