El mundo de los datos: data science y machine learning

1

Aprende ciencia y análisis de datos para optimizar las estrategias de tu negocio

2

Retos para aprender ciencia de datos

3

¿Qué es ciencia de datos y big data? ¿Cómo afectan a mi negocio?

4

¿Qué tipo de información podemos analizar?

5

¿Cómo crear empresas y culturas data-driven?

6

¿Qué es inteligencia artificial y machine learning?

7

¿Qué es deep learning? Análisis de imagen, audio y video

Herramientas y roles de trabajo en ciencia de datos

8

Flujo de trabajo en ciencia de datos: fases, roles y oportunidades laborales

9

Herramientas para cada etapa del análisis de datos

10

¿Qué es y cómo usar una base de datos relacional con SQL?

11

Cómo estructurar queries en SQL

12

Conflictos y retos actuales sobre la ética y tratamiento de datos

Problema de negocio: análisis

13

Aplica técnicas de storytelling para convertir problemas de datos en historias

14

Cómo estructurar un caso de negocio

15

Análisis cuantitativo en un caso de negocio

16

Análisis cualitativo en un caso de negocio

17

Fusión cuanti-cualitativa en un caso de negocio

18

¿Qué es minería de texto? ¿Cómo usarla para obtener información adicional?

19

Variación de comportamientos a partir de la geolocalización

Problema de negocio: implementación

20

Acciones, algoritmos y toma de decisiones según los resultados del análisis

21

Apuntes y cursos para aprender ciencia de datos

22

Continúa aprendiendo ciencia y análisis de datos para ejecutar estrategias efectivas

23

👥🦾 Actividades de la comunidad de la Escuela de Data Science e Inteligencia Artificial

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

¿Qué es minería de texto? ¿Cómo usarla para obtener información adicional?

18/23
Recursos

Aportes 138

Preguntas 15

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

Un ejemplo de análisis cualitativo, minería de textos, uso de machine learning y crowdsourcing es la plataforma ESTADO DE ÁNIMO DE LOS TWITTEROS EN MÉXICO 🇲🇽 les recomiendo checarla es muy interesante, puedes ver el estado de ánimo en determinadas zonas y fechas:
https://www.inegi.org.mx/app/animotuitero/#/app/multiline

La minería de textos es una rama específica de la minería de datos que se refiere al proceso de analizar y derivar información nueva de textos. Por medio de la identificación de patrones o correlaciones entre los términos se logra encontrar información que no está explícita dentro del texto. Los textos que se usan como recursos pueden ser páginas web, libros, correos electrónicos, reseñas de clientes, artículos, entre otros.

La minería de textos es un área multidisciplinaria basada en la recuperación de información, aprendizaje automáticoestadísticas y la lingüística computacional. Como la mayor parte de la información (más de un 80%) se encuentra actualmente almacenada como texto, se cree que la minería de textos tiene un gran valor comercial.

Por ejemplo: Twitter, tiene su base de negocio en la exploración de los mensajes.

La minería de texto se define como el proceso de descubrimiento de patrones
interesantes y nuevos conocimientos en una colección de textos, es decir, es el proceso encargado del descubrimiento de conocimientos que no existían explícitamente en ningún texto de la colección, pero que surgen de relacionar el contenido de varios de ellos.

Es un curso MUY ADICTIVO!

Mediante la minería de texto podemos crear nubes de palabras por categoría qu enos permitiría dar luces sobre cada una de estas.

Aquí un video que puede sumar

https://www.youtube.com/watch?v=I3cjbB38Z4A

PRINCIPALES LIBRERIAS PARA HACER ANÁLISIS DE TEXTOS

¿QUÉ ES LA MINERÍA DE TEXTOS?
La minería de textos busca extraer información útil e importante de formatos de documentos heterogéneos, tales como páginas web, correos electrónicos, medios sociales, artículos de revistas, etc. Esto se hace mediante la identificación de patrones dentro de los textos, tales como tendencias en el uso de palabras, estructura sintáctica, etc.

¿POR QUÉ LO NECESITAMOS?
La minería de textos nos puede ayudar a encontrar tecnologías nuevas e innovadoras dentro de ciertos dominios. Es un método muy eficiente para generar nueva información y conocimiento. Esta práctica permite a las empresas reducir el tiempo dedicado a la lectura de textos extensos y extractos literarios. Esto significa que los recursos clave se pueden encontrar con mayor rapidez y eficacia. También permite a los usuarios obtener nueva información que de otro modo sería difícil de encontrar.

Qué buena clase. Exploración de datos.

“Cuanto más complejos son los conjuntos de datos recopilados, mayor es el potencial que hay para descubrir insights relevantes”

https://www.sas.com/es_pe/insights/analytics/data-mining.html

Gracias Silvia, excelente curso.

Análisis de resultados:
La mayoría de nuestros clientes que llaman por quejas quieren una devolución, los únicos clientes en lo que esta característica no sobresale es con nuestros clientes oro, con los plata ya inicia a verse la palabra factura por lo que nos percatamos que pueden ser empresas las que nos llaman, podríamos identificar a las empresas y enviarles promociones.
En el caso de los usuarios oro también existe la palabra facturas pero ahora surge una palabra que es Log in esto hace referencia a que tienen problemas con los accesos siendo así un problema tecnológico.

MINERIA DE DATOS 😃 😃

Datos abiertos Colombia - Peticiones, Quejas y Reclamos de Televisión Abierta

El mejor uso que podría darle a la minería de texto en mi caso de negocio es entender cuales son las principales razones para las pqrs en cada categoría de clientes y las mejores respuestas para automatizarlas.

Minería de texto: extraer información adicional a través de los mensajes que nos dejan los usuarios

basicamente somos analizados en todo aspecto de nuestras vida… desde un like a un comentario en RRSS

Maravillosa esta técnica para el análisis de datos.

Este tema es uno de los más apasionantes en la ciencia de datos.

Woow, este curso ha sido muy increíble.

En Platzi esta este curso Ciencia de datos donde la profesora extrae información de la web (ej. Amazon) usando R Studio para analizar los comentarios de productos vs variables como precio, peso, marca, en un gráfico bastante interesante. Te lo recomiendo.

PROBLEMA: En el restaurante “El Chef”, las ganancias regulares que se tenían han bajado en comparación a las ganancias obtenidas el año pasado, ¿a qué se deberá?
'
Analizando los mensajes dentro de las categorías clasificadas:
En las anteriores clases, mencione que había diferentes tipos de “Customers” (clientes) y “Workers” (trabajadores de restaurante), y dentro de ellos expresé sus respectivas categorías, ahora buscaremos los mensajes que podemos encontrar dentro de estas, los cuales pueden ser:

a) Workers:

  • Con respecto a la asistencia, en el restaurante “el Chef”, los trabajadores para poder registrar su asistencia deben escribir su nombre, y enviarlo como un mensaje a un grupo creado por la empresa del restaurante, destinado para que sea la minería de texto con respecto al registro de asistencias.
  • Mediante los mensajes que se puede registrar entre las conversaciones entre los “Workers” y los “Customers”, mediante ellos, se puede identificar el interés y la calidad de atención que el cliente recibe de los trabajadores, y si es que ellos muestran una buena atención en una oportunidad, podemos saber si es que mantiene esta buena atención en otras oportunidades.
  • También, mediante los mensajes de texto entre las conversaciones entre los “Workers” y “Customers”, podemos identificar el número de ventas concretadas y las quejas o críticas constructivas que pueden recibir los trabajadores por parte de los clientes, y así con ayuda de la I.A, poder identificar si los comentarios que hacen los clientes hacia los trabajadores son positivos o negativos.

    Y además el registro de ventas efectuadas será contabilizado mediante los registros semanales de estas, los cuales deben ser enviados (cada semana) por cada trabajador al grupo de la empresa.

b) Customers:

Eso es todo muchas gracias por su atención de antemano, y les agradecería mucho si es que en algo estoy fallando, ayudarme en hacerme ver ese error porfavor. Gracias👍. #NeverStopLearning✨

Muy buen curso!. Es interesante todo el análisis que hace de la problemática empresarial a través de la mirada “data driven”. Sería muy bueno, si mas adelante en la ruta de ciencia de datos existiese un curso continuación de este donde enseñaran los detalles técnicos de este análisis. Por ejemplo: poder ver como se usa el texto de las quejas para clasificarlos ¿se hará a mano o se ocupará un modelo de NLP? Eso sería súper interesante!

El mejor uso que podría darle a la minería de texto en mi caso de negocio es …Comportamientos como Tasa de envio, Tarifa de devolución, Estado y/o calidad del producto, Facturas, fechas de pago.

Minería de texto: ayuda a entender los mensajes, el texto para clasificarlo y organizarlo de acuerdo a tus necesidades

¿QUÉ ES LA MINERÍA DE TEXTOS?

La minería de textos busca extraer información útil e importante de formatos de documentos heterogéneos, tales como páginas web, correos electrónicos, medios sociales, artículos de revistas, etc. Esto se hace mediante la identificación de patrones dentro de los textos, tales como tendencias en el uso de palabras, estructura sintáctica, etc.

La gente a menudo habla de «minería de texto y datos (TDM)» al mismo tiempo, pero estrictamente hablando la minería de texto es una forma específica de minería de datos que se relaciona con el texto.

¿POR QUÉ LO NECESITAMOS?

La minería de textos tiene muchas aplicaciones. Por ejemplo, la minería de textos puede ayudar a encontrar tecnologías nuevas e innovadoras dentro de ciertos dominios. Es un método muy eficiente para generar nueva información y conocimiento. Esta práctica permite a las empresas reducir el tiempo dedicado a la lectura de textos extensos y extractos literarios. Esto significa que los recursos clave se pueden encontrar con mayor rapidez y eficacia. También permite a los usuarios obtener nueva información que de otro modo sería difícil de encontrar.

¿QUÉ CLASE DE GENTE HACE MINERÍA DE TEXTOS?

La tecnología de la minería de textos es actualmente ampliamente aplicada por una extensa variedad de usuarios, desde organizaciones gubernamentales, instituciones de investigación y empresas para sus necesidades diarias. Estos son algunos ejemplos de uso en diferentes campos:

Investigación: por ejemplo, el descubrimiento de conocimientos, la atención médica y sanitaria: en el pasado, a un investigador humano le lleva mucho tiempo analizar y obtener información relevante. En algunos casos, esta información ni siquiera era accesible. La minería de textos permite a los investigadores encontrar más información y de forma más rápida y eficiente.

Negocios: por ejemplo, las grandes empresas utilizan la minería de textos para ayudar en la toma de decisiones y responder rápidamente a las consultas de los clientes en procesos tales como la gestión de riesgos o el filtrado de currículos

Seguridad: En anti-terrorismo, el análisis de los blogs y otras fuentes de texto en línea se utiliza para prevenir delitos en Internet y luchar contra el fraude.

Diariamente, La minería de texto es usada por los sitios web de correo electrónico para crear métodos de filtrado más confiables y efectivos, para el filtrado de spam, análisis de datos de medios sociales, etc. También para identificar las relaciones entre los usuarios y ciertos productos o para determinar las opiniones de los usuarios sobre temas particulares

¿ES ÚTIL LA MINERÍA DE TEXTOS PARA LA CIENCIA?

Los usos de la minería de textos son virtualmente interminables, pero vamos a centrarnos más en que manera es útil para la ciencia y la investigación. Los científicos se comunican a través de publicaciones científicas y se estima que existen más de 50 millones de revistas (JINHA, A. E. (2010), po lo cual cada vez es más difícil para los investigadores hacer un seguimiento de lo que se publica en su propio campo. Además, hay una enorme afluencia de otros tipos de datos en todas las ciencias, como páginas web, informes de organizaciones públicas (por ejemplo, transcripciones judiciales, actas de reuniones), libros, etc. La minería de textos puede ayudar a resolver este problema y a encontrar nueva información.

ESPERA UN MINUTO, ¿ASÍ ES COMO OBTENGO ESOS ANUNCIOS PERSONALIZADOS?

Como se ha dicho antes, las tecnologías de minería de texto tienen muchas aplicaciones. Entre ellas, se puede utilizar para establecer vínculos entre clientes potenciales y productos con fines de marketing o de otro tipo.

¿CUÁL ES LA DIFERENCIA ENTRE MINERÍA DE TEXTO Y GOOGLE?

Los motores de búsqueda como Google, recuperan todos los documentos que contienen las palabras clave que has especificado. No hay valor añadido a los datos. La minería de textos lleva las cosas un paso más allá al extraer información precisa basada en mucho más que palabras clave. En su lugar, busca entidades o conceptos, relaciones, frases y/o oraciones. Intenta determinar el significado real basado en algoritmos de Procesamiento del Lenguaje Natural (NLP), que le permiten reconocer conceptos similares. Una búsqueda utilizando la minería de texto puede identificar hechos, relaciones e inferencias que no son del todo obvios.

¿CÓMO FUNCIONA, ESTA MINERÍA DE TEXTO Y DATOS?
La extracción de textos puede dividirse en cinco pasos:

  1. Recolección: Recopilación de datos de diferentes recursos, tales como sitio web, correos electrónicos, comentarios de clientes, archivo de documentos. Dependiendo de la aplicación, este proceso puede ser completamente automatizado o guiado por una persona encargada de realizar este proceso.

  2. Preprocesamiento: La identificación del contenido y la extracción de características representativas

  3. Limpieza de textos: eliminación de cualquier información innecesaria o no deseada, como los anuncios de las páginas.

  4. Tokenización: un ordenador sólo «ve» una cadena de caracteres, sin poder identificar, por ejemplo, párrafos, frases o palabras. La Tokenización divide el texto en entidades significativas (palabras, oraciones, etc.) dados los espacios en blanco presentes y las puntuaciones.

  5. Extracción de características (también llamada selección de atributos): es el proceso de caracterización.

Un ejemplo puede ilustrar estos cinco pasos:

Imagina que estás vendiendo calendarios de animales. Si deseas saber si es una buena inversión para que se anuncie en los sitios web de blogs, y por lo tanto, te gustaría conocerqué porcentaje de las entradas en el blog están hablando de los animales.

En primer lugar, es necesario reunir todos los textos de todas las entradas de blog que puedas encontrar. Dado que puede haber cientos de miles de estos textos en Internet, probablemente no quieras descargarlos manualmente, uno por uno. Así que necesitas software para rastrear la web, descargar los artículos que encuentre y organizarlos en una base de datos apropiada.

En segundo lugar, querrás preprocesar el material recolectado para que las siguientes herramientas (discutidas en los pasos 3 a 5) puedan trabajar más eficientemente. Por ejemplo, querrás eliminar anuncios, menús de páginas web, código fuente de las páginas web HTML, etc. A continuación, es posible que desees calcular algunas características (extracción de características) para tu colección de textos. Por ejemplo, es posible que desees conocer el número de palabras de cada mensaje, de modo que pueda rechazar las que son demasiado pequeñas (por ejemplo, 10 palabras) o demasiado grandes (por ejemplo, 10 000 palabras). Tales entradas en su base de datos probablemente no son representativas y pueden ser errores generados por su software utilizado en el primer paso. Para obtener estos recuentos de palabras, primero tendrás que dividir los textos (serie de caracteres) en palabras (tokenización).

En el tercer paso, es posible que desees crear índices. Por ejemplo, para enumerar qué palabras se han encontrado en qué textos. Puedes pensar en esto como el índice de un libro. Sin un índice, es muy difícil localizar la información sobre un tema específico. Pero con un índice, es mucho más fácil y rápido encontrar lo que está buscando. Esto también es cierto para el software que busca palabras en su enorme base de datos blog.

Luego, en el cuarto paso, querrás extraer los textos para extraer alguna información que le ayudará a contestar sus preguntas. En este caso, querrás identificar palabras que se refieran a animales. Un nombre de entidad reconocedora de animales tratará de reconocer cada palabra que se refiera a un animal, como perro, gato, gatito, felino, mamífero, petirrojo americano, Turdus migratorius, etc. También es posible que desees ejecutar lo que se conoce como’ algoritmos sintácticos‘ para identificar qué palabras son sustantivos y cuáles verbos. Se necesitan muchos algoritmos para distinguir, por ejemplo, el uso de cat en «Tengo un gato hermoso» y que «ejecute cat file. txt en su línea de comandos para mostrar el texto.o rechazar «Se movió como una araña» Evidentemente, se necesita mucha inteligencia para llevar a cabo esta tarea con precisión.

A continuación, en el quinto paso, se desea realizar análisis y trazar gráficos. Por ejemplo, puedes requerir una gráfica de barra que muestre el porcentaje de artículos del blog que hablan sobre los animales para cada uno de los diez sitios web de alojamiento de blog más importantes. Con esta información, por ejemplo, puedes convencer a tus colaboradores de que es una buena idea invertir dinero en publicidad para calendarios de animales en whatablog. com.

Este artículo fue escrito como parte del proyecto OpenMinTeD por: Jiakang Chang (EMBL-EBI), Christian O’ Reilly (EPFL), Nancy Pontika (Open University) Gareth Owen (EMBL-EBI), Kenneth Haug (EMBL-EBI), Martine Oudenhoven (LIBER)

Según mi experiencia en call centers aveces la clasificación es asi: Regular: tienen una tendencia a mayor número de quejas y de retorno de dinero o producto Bronce: en esta categoría usualmente están más preocupados por la calidad y rapidez de el producto Plata: tienen más quejas referentes a la calidad o respecto a políticas de empresa Oro: Un cliente oro usualmente busca más información sobre las políticas de la empresa, la calidad de el producto y el trato que reciben de la empresa entre más ágil mejor y menos top offenders.

Este es un buen ejemplo gráfico de la Minería de Texto

Les comparto estos posts muy interesantes:
https://towardsdatascience.com/tagged/text-mining

Comparto un excelente post que explica muy bien lo qué es la minería de texto: https://universoabierto.org/2018/02/22/que-es-la-mineria-de-textos-como-funciona-y-por-que-es-util/

buscar cuantos problemas mas hay

La import de las quejas, excelente

De qué forma se leen los textos ? se pasan todos los correos y conversaciones por un algoritmo ?

Aquí unos videos que pueden sumar

¿Qué es la minería de datos?

¿Qué es la Minería de Texto?

What is Text Mining?

La minería de textos es el proceso de analizar colecciones de materiales de texto con el objeto de capturar los temas y conceptos clave y descubrir las relaciones ocultas y las tendencias existentes sin necesidad de conocer las palabras o los términos exactos que los autores han utilizado para expresar dichos conceptos. La minería de textos y la acción de recuperar información son conceptos que a veces se confunden, aunque son bastante diferentes. Una recuperación precisa de la información y su almacenamiento supone un reto importante, pero la extracción y administración de contenido de calidad, de terminología y de las relaciones contenidas en la información son procesos cruciales y determinantes.

La minería de texto puede dividirse en 5 pasos: 1-RecoleccionRecopilación de datos de diferentes recursos, tales como sitio web, correos electrónicos, comentarios de clientes, archivo de documentos.  2-Preprocesamiento:La identificación del contenido y la extracción de características representativas 3-Limpieza de texto:Eliminación de cualquier información innecesaria o no deseada, como los anuncios de las páginas. 4-Tokenizacion:La Tokenización divide el texto en entidades significativas (palabras, oraciones, etc.) dados los espacios en blanco presentes y las puntuaciones. 5-Extraccion de características: Simplemente es el proceso de caracterización.

Excelente, en esta clse aprendi mas sobre la perspectiva y como la experiencia en el negocio hace gran diferencia para validar los datos

Preguntas referentes clasificadas por tema:

Al tratarse de un restaurante, es natural que la mayoría de preguntas apunten a la devolución del dinero

  • Devolución de dinero
  1. ¿Como pido una devolucion de dinero si el plato no fue de mi agrado?
  2. ¿Tiempo de respuesta para la devolucion de mi dinero?
  • Quejas por tiempo de espera
  1. ¿Cuanto es el tiempo de espera regular en el restaurante?
  2. llevo esperando mas de 1 hora por un plato ¿Como pido mi devolucion de dinero?
  • Quejas por atención al cliente
  1. ¿Cómo reporto un caso de atención al cliente?
  2. ¿A quien debo dirigirme por un servicio negligente de parte del establecimiento?
  3. Mi experiencia en el restaurante fue pésima ¿Puedo obtener una compensación?
  • Comida en mal estado
  1. Mi plato estaba en mal estado, exijo devolucion del dinero
  • Preguntas
  1. ¿Donde puedo pedir facturacion electronica?
  2. A traves de que medios envio evidencias de un inconveniente dentro del establecimiento?

Son algunas de las preguntas que se me ocurren en este caso de negocio en particular

Les dejo el estado de animo de los tuiteros por dia de la semana.
periodo 2016-2022

¿Qué es la minería de texto? ¿Para que podemos usarla?

  1. Acumular y procesar los textos extrayendo información(palabras clave) de esta buscando correlación o causalidades.
  2. Para encontrar las tendencias de cada categoría(regular,bronce,plata,oro)

Muy bueno.

Información resumida de esta clase
#EstudiantesDePlatzi

  • La minería de texto nos ayuda a entender y medir la información que viene en tipo de texto
nuevo conocimiento minería de datos

Curso de algoritmos de clasificación de texto: https://platzi.com/clases/clasificacion-texto/

Aprendiendo a ser detective de los datos 😎

El mejor uso que podría darle a la minería de texto en mi caso de negocio es realizar el estudio de cuales son las quejas mas recurrentes y buscar el medio mas importante para poder visualizar el porque las quejas de los clientes según su caraterización (Regular - Oro) en este caso es muy similar al ejemploo expuesto para mi caso de negocio que es Mercado libre.

Piensa en los** mensajes** que podría haber dentro de las categorías que creaste. ¿Qué información adicional podrías encontrar analizando los textos relacionados a tu caso de negocio? ¿Cuáles serían los diferentes comportamientos?

El mejor uso que podría darle a la minería de texto en mi caso de negocio es …Los palzos de pagos, Tasa de interéses, Poco presupuesto, Auto no tiene el equipamiento deseado, Los vendedore no describen bien el producto.

  • Encontrar información contenida en el texto.
  • Cada categoría puede ser analizada en función a los textos que generan los usuarios en cada categoría.
  • Caso Platzi:
    • Entusiasta: Recomiendan activamente Platzi. Siguen, comentan y comparten en redes sociales a Platzi. Mandan correos con propuestas de mejora.
    • Decidido: Expresan su deseo de adquirir Platzi.
    • Indeciso: Piden recomendaciones de cursos. Preguntan sobre los precios. Expresan preocupaciones.
    • Negativo: No hay el curso que buscan. Expresan la incapacidad de comprar. Dicen que el nivel es bajo.
    • Odio: Expresan su incapacidad de compra. Dicen que el nivel es bajo. Mencionan comentarios negativos de los integrantes del Platzi.
  • El mejor uso que podría darle a la minería de texto en mi caso de negocio es … Devolución de dinero, descuento por mal asesoramiento, tiempo de indisponibilidad del servicio, configuración avanzada en dispositivos de la empresa.

El mejor uso que podría darle a la minería de texto en mi caso de negocio es comparar las frases que usan los clientes que no pagan y asi identificarlos con mucho más tiempo de antelación para tomar una mejor decisión sobre la estrategia de cobranza

¿Qué es minería de texto? ¿Cómo utilizarla para obtener información adicional?

  1. Buscar e investigar los mensajes de los clientes
  2. La utilizaremos para tener datos más detallo de las
    problemáticas o dudas de nuestros clientes.

ejemplo

Ejemplo de empresas de delivery de comida:

  • Clientes que se quejan de la empresa de delivery: retraso en la entrega de los pedidos, dificultades en los tipos de pago.
  • Cientes que se quejan de las empresas de comida: comida de mala calidad, porciones de menor tamaño que las mostradas en la plataforma, comida fría o no recién hecha, errores en el menú que ha solicitado o en el sabor de la bebida.
  • Clientes que se quejan de la plataforma: log in, pedidos duplicados, retardo en la respuesta, inconformidad con el chat bot, inexistencia de canales óptimos de comunicación.
  • Clientes que solicitan compensación económica: envíos duplicados, problemas con los cupones, devoluciones.
  • El mejor uso que podría darle a la minería de texto en mi caso de negocio es, por ejemplo al consultar a los certificadores ellos pueden mencionar que son muchos casos de prueba Para ejecutar en muy poco tiempo, que El sistema es muy grande y los casos de prueba muy demandantes, que El tomar las evidencias de los casos toman mucho tiempo.

Gracias

La analítica de texto (minería de texto o text mining) engloba al conjunto de técnicas que permiten estructurar la información heterogénea presente en los textos con el objetivo de identificar patrones tales como el uso de palabras, con los que extraer nueva información.

Twitter es actualmente una dinámica e ingente fuente de contenidos que, dada su popularidad e impacto, se ha convertido en la principal fuente de información para estudios de Social Media Analytics. Análisis de reputación de empresas, productos o personalidades, estudios de impacto de marketing, extracción de opiniones y predicción de tendencias son sólo algunos ejemplos de aplicaciones. Este tutorial pretende servir de introducción al análisis de texto (text mining) con Python. Para ello, se analizan las publicaciones que han hecho en Twitter diferentes personalidades con el objetivo de:

Identificar las palabras empleadas por cada uno de los usuarios.

Crear un modelo de machine learning capaz de clasificar la autoría de las publicaciones en base a su texto.

Análisis de sentimientos

Minería de texto

Reto:
El mejor uso que podría darle a la minería de texto en mi caso de negocio es indagar información adicional de las causas de las quejas de los trabajadores en el rubro de plásticos: falta de apoyo personal en TI, falta de corriente de aire en el local para evitar un posible rebrote de contagios covid y provisión de suministros de limpieza en planta.

El mejor uso que podría darle a la minería de texto en mi caso de negocio es indagar información adicional de las causas de pedir una beca de bajos recursos cuando no lo son.

  • El mejor uso que podría darle a la minería de texto en mi caso de negocio es buscar información adicional en grupos de facebook que tengan como objetivo informar sobre robos y casos de inseguridad en la ciudad de Ibagué.

El mejor uso que podría darle a la minería de texto en mi caso de negocio es utilizar este tipo de minería para poder encontrar mejor los problemas específicos con mis clientes, además observar si existe algún problema con la tecnología y encontrar que es lo que buscan más nuestros clientes de la compañía.

Reto:
El mejor uso que podría darle a la minería de texto en mi caso de negocio es indagar información adicional de las causas de las quejas de los trabajadores agrarios: falta de puntos de recarga de baterías de celulares en campo, apoyo de personal de TI en campo y provisión de suministros de limpieza para celulares en campo.

¡Se está poniendo muy EMOCIONANTE! 😄

Solución al reto:
Piensa en los mensajes que podría haber dentro de las categorías que creaste. ¿Qué información adicional podrías encontrar analizando los textos relacionados a tu caso de negocio? ¿Cuáles serían los diferentes comportamientos?

El mejor uso que podría darle a la minería de texto en mi caso de negocio es:
  • Comercios: Ese comercio no acumulo mis puntos, Compro y no acumulo, No avisan que no manejan puntos.

  • Problemas tecnológicos: ¿Como puedo acumular puntos?, No detecta en donde hago la acumulación, No reconocen mis datos para acumular.

uso de la minería de texto para entender por qué los usuarios se habían quejado

Se esta poniendo emocionante verdad? Yo aplaudiendo como loca diciendo si jajajaja

En retail de ropa y accesorios la mayoría de quejas son por devolución de dinero y cambio de producto.

Palabras clave:
Roto
No funciona
Llego tarde
Lento
Devolución
No me gusto
No es lo que esperaba

  • La geolocalización de mis usuarios podría comparar el número de clientes registrados que tengo por ciudad vs el número de carritos abandonados por ciudad, de este modo validaría mi hipótesis de que mis clientes registrados abandonan menos carritos, ya que se dedican a comprar y no solo a comparar.
  • El mejor uso que podría darle a la minería de texto en mi caso de negocio es ver cuánto tiempo pasan en mi sitio y además rastrear el comportamiento para validar si están navegando en mi sitio, sacando precios y totales (en el checkout) para después ir y terminar su compra en mi portal de mayoristas, esta comparación podría estar provocando ese comportamiento.

El uso de la minería de texto en mi caso de negocio nos podría indicar a qué hora son más frecuente los hechos, quienes llevaron a cabo los hechos y los faltantes en inventario y en caja.

El mejor uso que podría darle a la minería de texto en mi caso de negocio es entender si la demora en respuesta es por falta de personal o mal manejo de la información.

En el caso de la casa de cambio de Binance podríamos observar esto:
Sí dimos a los usuarios en diferentes categorías podríamos observar qué los diferentes problemas se agrupan en la falta de conocimiento sobre cómo usar la plataforma y diferentes formas de saltar o no pagar al hacer una transacción entre 2 partes.

El mejor uso que podría darle a la minería de texto en mi caso de negocio es la reafirmación de aspectos necesitan una mejora inmediata en los gimnasios para la fidelización y retención de usuarios. Además, creo que podría encontrar otros problemas como muestro en la imagen:

Mi caso propuesto es :

En una empresa de transporte y envíos aéreos, se detectó fraude en la facturación y recaudo de cierto tipo de envíos a todo el país.
en este caso la minería de texto nos conduciría a explorr los motivos:

Es mas fácil hacer fraude en paquetes pequeños que van al norte y occidente del país porque:

  • son mas numerosos

  • menos voluminosos

  • menos detectables

  • dejan mas rentabilidad.

Me gusto mucho la Explicacion

Me encanta cuando con datos cuantitativos y cualitativos podemos llegar a conclusiones sobre que es lo que esta pasando y como podemos resolverlo, teniendo el horizonte mas claro.
.
Sin duda es un largo camino pero muy emocionante

Cómo comente en los anteriores videos, el analisis cualitativo me llevaría a usar minería de texto, identificando las palabras más utilizadas al describir las quejas de los usuarios, a través de los diferentes canales.

No con texto pero he tratado de adivinar los motivos de las correciones en BTC

La informacion que puedo sacar, leyendo los textos sería, quejas del funcionamiento del bot, si están escribiendo porque les interesa o es span. Si solo buscan cotizar el producto.

El mejor uso que podría darle a la minería de texto en mi caso de negocio es validar si la estructura de las preguntas hechas con los usuarios guardan una lógica entendible, además de corroborar si las palabras claves usadas tienen una relación con tema del cual se está hablando en la clase.
Se podría ver que patrón tienen las preguntas ignoradas, quizás su contexto no genera atractivo para los demás usuarios y por eso no responden.

Esos “Regulares” como se quejan jajaja

Continuando mi historia de sarlaft, diria:

  • El mejor uso que podría darle a la minería de texto en mi caso de negocio es …encontrar personas relacionadas con mis clientes principales, que también esten realizando actividades sospechosas, encontraria información que no justifique el origen de sus recursos, porque no tiene coherencia lo que me dice con la documentación entregada.

En el caso de 0-50 puede ser:

  • Falta de tiempo
  • Juego muy complicado
  • No lo conocen

En el caso de 51-100:

  • Juego muy complicado
  • Juegan una versión pirata del juego

En el caso de 101-200:

  • Juego divertido
  • Los datos que se tienen son correctos
  • Faltan licencias
  • Entienden las dinamicas del juego

En el caso 200+:

  • No importan las licencias
  • Adicción al juego
  • Entienden a la perfección el juego

Docentes: Log in - Acceso a bases de textos cienficos
Administrativos: Log in- Acceso a servidores - Politicas de Acceso
Proveedores: Acceso a Servidores - Informacion Confidencial - Politicas de Acceso

El mejor uso que podría darle a la minería de texto en mi caso de negocio es … Para determinar con una gran certeza tengo en cuenta que es lo que me tratan de decir, con ello, puedo realizar adecuadamente la validación de que se haga como debe mi proceso de fusión y sea correcto como debería. También puede ayudar a ver, si son problemas externos o internos que como empresa debemos renovar o mejorar.

En mi caso de negocio, por medio de la minería de texto se puede identificar las razones que llevan a un usuario a no utilizar los reportes existentes y solicitar nuevos informe. Y a identificar qué tipo de inconsistencia se detecta al comparar los reportes existentes

La minería de texto en mi caso de negocio sería:

  • monto de devolución
  • tasa de envío
  • falla en la geo localización en el repartidor
  • entrega del producto en malas condiciones

Con la minería de texto tenemos los siguiente con las tomas inoperativas en el aeropuerto:

-Pasajero nacional:
-La toma USB no sirve.
-Los puntos de recarga no son identificables
-Pasajero Internacional.:
-No se encontró los puntos recarga disponible
-la toma USB no sirve.
-Pasajero Mixto
-La toma USB no sirve.
-Los puntos de recarga no son identificables
-No se encontró los puntos recarga disponible

El mejor uso que podría darle a la minería de texto en mi caso de negocio es Que no les gusta la calidad de la lehuga, que no esta fresca la lechuga, como nuevos motivos

  • El mejor uso que podría darle a la minería de texto en mi caso de negocio es definiendo de acuerdo al tipo de reporte los principales motivos de reporte de cada solicitud o información principal que se suele brindar o solicitar en este tipo de reportes, por ejemplo para el caso de accidentes 3 cosas que suele mencionar o preguntar el conductor es por el cubrimiento del seguro, información o imagenes de como ocurrio el accidente y si producto del accidente alguien resulto herido o sufrio daños el vehículo.

Mineria de Texto

  • Podemos extraer mucha infromación adicional a través de la lectura de los textos, esto puede ser engorroso pero para eso agrupamos nuestros datos de manera que podemos analizar los más relevantes, además de haber herramietas de procesamiento de lenguaje y texto a nuestra disposición
  • El mejor uso que podría darle a la minería de texto en Mi caso de negocio es … motivos de falla de equipos, retrasos en obras, direcciones erróneas, no se encuentra personal para atender las dudas

Me gusta la estructura del curso, me da lugar a pensar en cómo podría aplicar estos procesos a mi contexto, por ejemplo mi lugar de trabajo.

  • El mejor uso que podría darle a la minería de texto en mi caso de negocio es …

Caso ocultar los tweets que se consideran ofensivos en twitter con una advertencia si la persona quiere leerlos

  • El mejor uso que podría darle a la minería de texto en mi caso de negocio es …

ver cuales son los topicos que generan estos mensajes ofensivos

ver si son mesajes que poseen palabras obscenas o el mensajes consiste unicamente de palabras obscenas

estos mensajes son parte de un conflicto o discusion en la plataforma

son mensaje ofensivos por un tema externo a un dialogo o son respuesta a un mensaje hecho por otra persona

Poder identificar mediante minería de texto las principales causas de queja y englobarlas en enunciados simples y concretos

Variables categóricas en mi caso de negocio: Clientes GOLD: 254, CLIENTE: PREFERENCIAL: 578 ESTANDAR: 2476

Este es un problema grande cuando son cumulos de informacion no parametrizada y con texto particularizado segun usuario, como podria leer estos textos en una base de datos de grandes cantidades?

El mejor uso que podría darle a la minería de texto en mi caso de negocio es … composición de los parrafos, palabras clave para atracción de personas, temas de interes para profundización

Caso programa Rhinoceros (top freetrailers)
Saber cuales son los problemas con el programa (Para saber si es que necesitamos mejorar la ubicación o una herramienta en general, o si les está costando mucho saber como funciona el programa)
En el caso de usuarios insatisfechos ( saber cual es la razón de su mala experiencia, en que se está rezagando el programa, que le faltaría para ganar a esos usuarios)
En motivos económicos (Validar si está demasiado caro en relación al contexto de cada país o si es demasiado para el uso que cada uno le da, etc)
Acomodados por tipo de usuario