No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Convierte tus certificados en títulos universitarios en USA

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

17 Días
0 Hrs
30 Min
10 Seg

NLTK para traducción de palabras

17/24
Recursos

Aportes 10

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Me gustaria implementar algo asi pero al lenguaje de señas colombiano por medio de lectura de lectura de imagenes y opencv
algun concejo??

Uff. Justamente lo que estoy haciendo de tesis es lo que comenta al final. Pero apenas estoy aprendiendo NLP. Despues haria falta colocar una capa de ML de la cual filtre el contenido relevante en dichos tweets.

No se puede usar swadesh actualmente, pero les dejo la api de nltk para traducción

https://www.nltk.org/api/nltk.translate.api.html

Nota:

Estos corpus de nltk no pueden ser utilizadon para la traduccion de parrafos. Ya que en general no contienen las palabras incluidas cada respectivo lenguaje.

Si ejecutas el siguiente codigo para traducir la palabra ‘house’ de ingles a español te dara un KeyError porque la palabra no esta disponible

from nltk.corpus import swadesh

en2es = swadesh.entries(['en', 'es'])
translate = dict(en2es)
translate['house']

La lista de Swaddesh fue creada por el lingüista Morris Swadesh en la década de 1950.

Es una lista de palabras que se consideran universales (presentes en la mayoría de las lenguas) como ‘yo’, ‘perro’, ‘agua’, ‘cielo’. Por eso, se utiliza para hacer lingüística histórica, por ejemplo, comparando la similitud léxica entre lenguas.

Tengo una duda. Hace muchos meses salió GPT-3, un juguete de OpenAI que tiene un motor de NLP impresionante. Sin embargo, hasta donde entiendo, todos los procesos los hace en el idioma inglés. ¿Es posible hace una traducción tanto de input como de output del modelo sin perder efectividad?

Para realizar traducciones de párrafos es mejor usar “Swadesh” o usar el api de Translate de Google?

La biblioteca **NLTK** incluye el **corpus Swadesh**, que es una lista léxica comparativa de vocabulario básico en diferentes idiomas. El corpus **Swadesh** se utiliza comúnmente en lingüística comparativa para estudiar la evolución de los lenguajes y su relación entre sí. Este corpus contiene traducciones de una lista de aproximadamente 200 palabras básicas en varios idiomas.

Francisco eres un excelente profesor !

Parece que solo acepta palabras en minúscula