Hola! Tengo un problema al tratar de pasar un texto a <code>np_array()</code> que está en formato unicode. Me aparece <code>UnicodeEncode...

Mario Alberto García Meza

Mario Alberto García Meza

Pregunta
teacherhace 5 años

Hola! Tengo un problema al tratar de pasar un texto a

np_array()
que está en formato unicode. Me aparece

UnicodeEncodeError: 'ascii' codec can't encode character '\xe9' in position 5: ordinal not in range(128)

Alguien sabe como arreglarlo?

2 respuestas
para escribir tu comentario
    Mario Alberto García Meza

    Mario Alberto García Meza

    teacherhace 5 años

    Me parece que al importarlo le cambia de unicode a ascii. Tal vez haya forma de que lo extraiga como unicode? encode() si me funcionó, muchas gracias! Aparece México como b'M\xc3\xa9xico', eso si... pero si funciona.

Curso de NLP con Python y NLTK [Empieza Gratis]

Curso de NLP con Python y NLTK [Empieza Gratis]

Analiza el Procesamiento de Lenguaje Natural con Python y NLTK. Descubre cómo tokenizar texto, encontrar colocaciones y medir similitudes semánticas. Aprende a procesar datos desde la web e implementar técnicas de limpieza de texto.

Curso de NLP con Python y NLTK [Empieza Gratis]
Curso de NLP con Python y NLTK [Empieza Gratis]

Curso de NLP con Python y NLTK [Empieza Gratis]

Analiza el Procesamiento de Lenguaje Natural con Python y NLTK. Descubre cómo tokenizar texto, encontrar colocaciones y medir similitudes semánticas. Aprende a procesar datos desde la web e implementar técnicas de limpieza de texto.