Análisis de Sentimientos de Tweets con Vectores de Palabras
Clase 11 de 28 • Curso de Introducción al Álgebra Lineal: Vectores
Contenido del curso
- 2

Vectores y Escalares: Conceptos y Operaciones Básicas
19:16 - 3

Convenciones y Notación en Vectores y Escalares
09:04 - 4

Modelo RGB y su implementación en Python
11:50 - 5

Adición de Vectores: Conceptos y Propiedades Básicas
08:03 - 6

Suma de Vectores en Python con NumPy
10:30 - 7

Producto Escalar-Vectores: Conceptos y Propiedades Básicas
16:56 - 8

Operaciones con Escalares y Vectores en Python usando NumPy
18:37 - 9

Producto Interno de Vectores: Definición y Propiedades
12:45 - 10

Producto Interno de Vectores en Python con NumPy
12:20 - 11

Análisis de Sentimientos de Tweets con Vectores de Palabras
16:00
- 12

Funciones Lineales: Transformación de Vectores en Escalares
11:50 - 13

Funciones Lineales y Propiedades de Superposición
14:22 - 14

Teoremas y Corolarios en Funciones Lineales
18:02 - 15

Funciones Afines: Propiedades y Ejercicios Prácticos
10:02 - 16

Aproximaciones de Taylor: Modelos Lineales de Funciones No Lineales
08:38 - 17

Aproximaciones de Taylor y análisis de error en Python
13:48 - 18

Regresión Lineal con Datos Geográficos y Socioeconómicos
22:26
- 19

Propiedades y Cálculo de la Norma de Vectores
17:18 - 20

Cálculo de Distancias entre Vectores usando Normas Euclidianas y LP
22:47 - 21

Optimización de Visitas para Arrendar Departamentos
10:11 - 22

Cálculo de Desviación Estándar en Series de Tiempo con NumPy
16:29 - 23

Modelo de Riesgo Retorno en Inversiones de Acciones
12:57 - 24

Cálculo de Ángulos y Correlación entre Vectores
10:29
¿Cómo desarrollar un análisis de sentimientos de tweets?
El análisis de sentimientos es una herramienta poderosa para comprender el tono y las emociones detrás de los textos y, en este caso, de los tweets. Aunque no realizaremos un procesamiento avanzado del lenguaje natural, aprenderás a detectar signos de positividad, neutralidad o negatividad mediante un enfoque más sencillo, observando características específicas de los enunciados. Vamos a construir una máquina de análisis y analizar la calidad de nuestro trabajo.
¿Cómo manejamos los datos textuales?
Comencemos por considerar cada tweet como una cadena que podemos analizar. Queremos eliminar elementos no deseados y enfocar nuestra atención en términos específicos que denoten el sentimiento. Utilizaremos funciones básicas para manejar cadenas de texto:
replace(): Útil para eliminar símbolos como signos de exclamación o comas.split(): Divide la cadena en un vector de palabras usando espacios como separadores.
Estos pasos nos permiten limpiar los textos para un análisis más preciso.
¿Cómo identificamos y cuantificamos las palabras clave?
Para obtener un vector de características, buscaremos en nuestros tweets palabras de interés, tales como "muerte", "pérdida", "excelente" o "gran":
# Ejemplo en Python
emoticones = ['<:)','<3']
# nuestra función es la siguiente
def palabra_etiqueta(texto, etiquetas, emoticones):
puntuacion = 0
palabra = texto.split()
for e in emoticones:
if e in texto:
puntuacion += 1
for w in palabra:
if w in etiquetas:
puntuacion += 1
else:
puntuacion -= 1
return puntuacion
Con esto, creamos un vector w que refleja la ocurrencia de estas palabras en cada tweet. Si una palabra aparece varias veces, su conteo se incrementa.
¿Cómo evaluamos el sentimiento?
Construimos un vector de sentimientos para clasificar las palabras en positivas, neutras y negativas:
- Positivas: "excelente", "gran", "positivo".
- Neutras: "pérdida".
- Negativas: "muerte", "luto".
Estos registros nos ayudan a determinar un score sentimental que compara las palabras positivas y negativas.
¿Qué se mide y cómo lo interpretamos?
Para evaluar la calidad de nuestro análisis, calculamos el promedio del vector w. Esto considera cuántas veces aparecen las palabras que nos interesan:
- Si el promedio es 1: Buen resultado.
- Mayor a 1: Alta frecuencia de coincidencias.
- Menor de 1 y mayor de 0.5: Resultados más inciertos.
- Menor de 0.5: Calidad deficiente.
Este análisis de calidad nos muestra la efectividad del análisis de sentimientos.
¿Cómo contestar las preguntas críticas del análisis?
Al final del ejercicio, deberás responder algunas preguntas clave:
- ¿Qué tweet es el más positivo o el más negativo?
- ¿Cuál es la calidad promedio de tus análisis?
- ¿Qué relación hay entre la calidad y el score?
Experimentos adicionales podrían incluir jugar con diferentes palabras clave para afinar la calidad y el score de los resultados. Cada ajuste y reevaluación te permitirá mejorar tus habilidades de análisis y entender mejor la influencia de las palabras en la percepción emocional de los textos.