Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Naive Bayes en Python: preparación de los datos

22/26
Recursos

Aportes 3

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Librerías para NLP

NLTK: Esta es la lib con la que todos empiezan, sirve mucho para pre-procesamiento, crear los tokens, stemming, POS tagging, etc
https://www.nltk.org/

TextBlob: fue creada encima de NLYK y es fácil de usar. Incluye algunas funcionalidades adicionales como análisis de sentimiento y spell check.
https://textblob.readthedocs.io/en/dev/

Gensim: contruida específicamente para modelado de temas e incluye multiples técnicas (LDA y LSI). También calcula similitud de documentos.
https://radimrehurek.com/gensim/

SpaCy: Puede hacer muchísimas cosas al estilo de NLTK pero es bastante más rápido.
https://spacy.io/

Excelente

Yo use adapte el código de la clase de SPAM para diferenciar entre textos de diseño y técnicos, conseguí un 88% de eficiencia, me pregunto si conseguiré mas con el código de las siguientes clases.