NLP: El procesamiento de lenguaje natural esta más enfocado hacia aplicaciones practicas en la ingeniería
LC : La lingüística computacional estudia el lenguaje desde una perspectiva más científica. (Basada en crear modelos que pueden tener dos enfoques de conocimiento o datos)
El procesamiento de una cadena de texto necesita una Normalización que incluye los siguientes procesos:
- Tokenización: Separar en palabras toda la cadena de texto
- Lematización: Convertir cada una de las palabras a su raiz fundamental
- Segmentación: Separación en frases (puede ser con las comas)
CORPUS: Colección de muchos textos
CORPORA: Colección de colecciones de texto
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?