¿que características debe cumplir un archivo csv para que funcione con pandas y lo lea? Me da este error en mi cvs perfectamente formado ...

Pregunta de la clase:
Agrupamiento de datasets
Oscar Unzueta Salazar

Oscar Unzueta Salazar

Pregunta
studenthace 4 años

¿que características debe cumplir un archivo csv para que funcione con pandas y lo lea?

Me da este error en mi cvs perfectamente formado y subido a mi Drive con permisos públicos al usar pd.read_csv(a):

ParserError Traceback (most recent call last)

<ipython-input-34-d0b0d35310fd> in <module>()

----> 1 pd.read_csv(a)

3 frames

/usr/local/lib/python3.6/dist-packages/pandas/io/parsers.py in read(self, nrows)

2155 def read(self, nrows=None):

2156 try:

-> 2157 data = self._reader.read(nrows)

2158 except StopIteration:

2159 if self._first_chunk:

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader.read()

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._read_low_memory()

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._read_rows()

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._tokenize_rows()

pandas/_libs/parsers.pyx in pandas._libs.parsers.raise_parser_error()

ParserError: Error tokenizing data. C error: Expected 285 fields in line 135, saw 427

Nota: el csv es :

a,b,c,d,e

f,g,h,i,j

1,2,3,4,5

4 respuestas
para escribir tu comentario
    Jon Francis Perez

    Jon Francis Perez

    studenthace 3 años

    Al parecer es un problema con el separador o "confusión" con el nombre de las columnas. Prueba alguna de estas soluciones, y comenta si lo pudiste solucionar incluyendo alguno de estos parámetros:

    pd.read_csv(a, sep=',', header=None)
    pd.read_csv(a, sep='\t')
    pd.read_csv(a.csv, on_bad_lines='skip')
    pd.read_csv(a, skiprows=[número de filas a saltar])
    Oscar Unzueta Salazar

    Oscar Unzueta Salazar

    studenthace 4 años

    Mi archivo CSV es simplemente el siguiente y no lo reconoce, son cuatro filas separadas por comas sin cabecera, un archivo CSV de pruebas correcto llamado a.csv alojado en Google Drive como a.csv:

    a,b,c,d,e f,g,h,i,j 1,2,3,4,5

    Le llamo por su URL: a=https://drive.google.com/file/d/1GUA8xsC_AQsMN5SSuoyIlEYi-shSqycE/view?usp=sharing

    Y da el error que pongo arriba al tratar de leerlo con pd.read_csv (a).

    Daniel Reyes Barrera

    Daniel Reyes Barrera

    studenthace 4 años

    La siguiente estructura es típica para un archivo CSV:

    • Definición de las columnas en la cabecera de la tabla.
    • Un carácter se utiliza para separar registros individuales.
    • Un carácter se utiliza para separar columnas individuales (comas, tabulaciones o espacios).
    • Delimitador de campos Carácter especial HTML dentro del archivo para evitar confusiones con los separadores.

    No existe un formato uniforme para los archivos CSV. Cuando se recogen datos para un software de lectura especial, el formato debe definirse de antemano para evitar errores. Por lo tanto, se producen problemas al leer los datos de fecha y hora. Del mismo modo, es posible que un exceso de texto provoque errores de lectura.

    Miguel Angel Velazquez Romero

    Miguel Angel Velazquez Romero

    studenthace 4 años

    ¿Qué te parece si mejor nos compartes una captura del problema?

Curso de Análisis Exploratorio de Datos

Curso de Análisis Exploratorio de Datos

Avanza tu carrera en ciencia de datos con la capacidad de entender los datos con los que trabajas. Con este curso serás capaz de conocer la naturaleza de tus datos, de entender su distribución y de explorarlos mediante análisis estadístico, herramientas de visualización y procesamiento de series de tiempo. Así podrás proponer el modelo más adecuado para el problema a solucionar.

Curso de Análisis Exploratorio de Datos
Curso de Análisis Exploratorio de Datos

Curso de Análisis Exploratorio de Datos

Avanza tu carrera en ciencia de datos con la capacidad de entender los datos con los que trabajas. Con este curso serás capaz de conocer la naturaleza de tus datos, de entender su distribución y de explorarlos mediante análisis estadístico, herramientas de visualización y procesamiento de series de tiempo. Así podrás proponer el modelo más adecuado para el problema a solucionar.