70

¿Minar datos y pensamientos?

58438Puntos

hace 5 años

¿Cómo se desmenuzan nuestras conversaciones para dar esos resultados del producto que pensaste querías comprar? ¿Qué pasa con nuestro lenguaje usado en internet? ¿y la variedad de datos?

El data mining es un proceso de categorización de enormes cantidades de datos para identificar tendencias y patrones para así crear relaciones. Desde páginas web, dispositivos móviles hasta el Internet de las cosas, estamos exponiendo nuestra información.

Si pensamos desde el punto de vista de un hombre de negocios, quizás ver los resultados de nuestro comportamiento en la red no sea suficiente. Para las grandes empresas, la idea es anticipar las tendencias y tomar decisiones ventajosas.

¿Qué abarca la minería de datos?

El término mining data abarca muchos conceptos como recolección, extracción, almacenamiento y análisis de datos. También suele relacionarse con inteligencia artificial, machine learning y business intelligence.

En áreas como desarrollo de producto, ventas, mercadeo, genética, cibernética se está implementando la minería de datos y la lista no para aquí. Veremos algunos elementos principales que se usan en la actualidad para hacer data mining.

Conoce nuestra ruta especializada con cursos de Data Analytics.

Algunos componentes clave para minar datos

Pre-procesamiento

Antes de aplicar algoritmos de minería de datos, debes construir un conjunto de datos objetivo (target data set).

Limpieza y preparación de datos

Es necesario eliminar el “ruido” y limpiar el conjunto de datos objetivo. Tener cuidado con valores faltantes y filtrar datos aislados para eliminar errores o hacer más exploración. Crear reglas de segmentación.

Aprendizaje de reglas de asociación

Son herramientas que buscan relaciones entre variables de un conjunto de datos. Por ejemplo: cuáles artículos tienden a venderse más rápido de acuerdo al clima.

Clustering (agrupamiento)

Es usado para descubrir grupos y estructuras en conjuntos de datos que tienen ciertas similitudes sin usar estructuras ya conocidas en datos.

Clasificación

Herramientas que hacen clasificación generalizan estructuras conocidas para aplicar nuevos puntos de datos, ejemplo, cuando una aplicación de correo clasifica un mensaje como legítimo o spam.

Regresión

Esta técnica es usada para predecir un rango numérico de valores, como ventas, valores, cifras, temperaturas o precios.

Summarization (resumen)

Con esta técnica puedes hacer representaciones compactas de conjuntos de datos, incluyendo visualizaciones y generación de reportes.

Algunas aplicaciones

En la educación

Este sector se puede beneficiar mucho al analizar conjuntos de datos para predecir el futuro comportamiento del aprendizaje y rendimiento de los estudiantes. Luego se puede usar este conocimiento para hacer mejoras en los métodos de enseñanza.

En la de salud

Puedes analizar la data para determinar mejores maneras de entregar el servicio a pacientes y reducir costos. Es posible predecir cuantos pacientes necesitarán cuidado medico y que tipo de servicio usarán.

En los bancos

La obtención de patrones de preferencia hará que los bancos puedan mejorar la lealtad que tienen sus usuarios hacia ellos. En otras palabras, los datos analizados de las cuentas, transacciones y canales de preferidos se usarán para suplir la necesidad de los clientes de la mejor manera.

El mundo necesita cada vez más especialistas y las técnicas irán cambiando de acuerdo a las necesidades. Si quieres empezar en este fascinante mundo de datos o reciclar conocimientos te recomiendo el curso de fundamentos de bases de datos. Ya lo sabes, ¡La información es dinero!

Néstor Iván
Néstor Iván
nescep

58438Puntos

hace 5 años

Todas sus entradas
Escribe tu comentario
+ 2
Ordenar por:
3
9461Puntos

buen articulo, sin duda el estudio de la información que nos brindan las bases de datos es una de las cosas mas interesantes. Podrá ser que algún día logremos construir una especie de oráculo griego a partir de nuestra información?Saludos

3
21088Puntos

que buen articulo!!! gracias!!

2

Muy interesante, hace tiempo que quería leer acerca, precisamente del Data Mining, buen articulo!!

1
50130Puntos

La minería de datos es un mundo super amplio.

¿Cuál es la mejor manera de utilizarlo en la industria de la construcción?

1
4917Puntos

Me gustaría haber leído algún ejemplo de clustering, pero realmente el artículo es fantástico. Gracias!!

1
8255Puntos

la información es dinero, excelente frase.

1
1052Puntos

Bastante completa la información del articulo. Un abrazo.

1
117436Puntos

Cuanta frescura en este artículo que hace todo tan entendible. Me gusta. Gracias Nestor

1
21088Puntos

“El mundo necesita cada vez más especialistas y las técnicas irán cambiando de acuerdo a las necesidades.”

Acabo de empezar a estudiar análisis de datos y todo esto me ha encantado!! gracias!!! buen articulo 😃

1
6553Puntos

Buen aporte. Gracias

0
4027Puntos

Excelente las técnicas de minería de datos