70

¿Minar datos y pensamientos?

58501Puntos

hace 5 años

Comparte en:

¿Cómo se desmenuzan nuestras conversaciones para dar esos resultados del producto que pensaste querías comprar? ¿Qué pasa con nuestro lenguaje usado en internet? ¿y la variedad de datos?

El data mining es un proceso de categorización de enormes cantidades de datos para identificar tendencias y patrones para así crear relaciones. Desde páginas web, dispositivos móviles hasta el Internet de las cosas, estamos exponiendo nuestra información.

Si pensamos desde el punto de vista de un hombre de negocios, quizás ver los resultados de nuestro comportamiento en la red no sea suficiente. Para las grandes empresas, la idea es anticipar las tendencias y tomar decisiones ventajosas.

¿Qué abarca la minería de datos?

El término mining data abarca muchos conceptos como recolección, extracción, almacenamiento y análisis de datos. También suele relacionarse con inteligencia artificial, machine learning y business intelligence.

En áreas como desarrollo de producto, ventas, mercadeo, genética, cibernética se está implementando la minería de datos y la lista no para aquí. Veremos algunos elementos principales que se usan en la actualidad para hacer data mining.

Conoce nuestra ruta especializada con cursos de Data Analytics.

Algunos componentes clave para minar datos

Pre-procesamiento

Antes de aplicar algoritmos de minería de datos, debes construir un conjunto de datos objetivo (target data set).

Limpieza y preparación de datos

Es necesario eliminar el “ruido” y limpiar el conjunto de datos objetivo. Tener cuidado con valores faltantes y filtrar datos aislados para eliminar errores o hacer más exploración. Crear reglas de segmentación.

Aprendizaje de reglas de asociación

Son herramientas que buscan relaciones entre variables de un conjunto de datos. Por ejemplo: cuáles artículos tienden a venderse más rápido de acuerdo al clima.

Clustering (agrupamiento)

Es usado para descubrir grupos y estructuras en conjuntos de datos que tienen ciertas similitudes sin usar estructuras ya conocidas en datos.

Clasificación

Herramientas que hacen clasificación generalizan estructuras conocidas para aplicar nuevos puntos de datos, ejemplo, cuando una aplicación de correo clasifica un mensaje como legítimo o spam.

Regresión

Esta técnica es usada para predecir un rango numérico de valores, como ventas, valores, cifras, temperaturas o precios.

Summarization (resumen)

Con esta técnica puedes hacer representaciones compactas de conjuntos de datos, incluyendo visualizaciones y generación de reportes.

Algunas aplicaciones

En la educación

Este sector se puede beneficiar mucho al analizar conjuntos de datos para predecir el futuro comportamiento del aprendizaje y rendimiento de los estudiantes. Luego se puede usar este conocimiento para hacer mejoras en los métodos de enseñanza.

En la de salud

Puedes analizar la data para determinar mejores maneras de entregar el servicio a pacientes y reducir costos. Es posible predecir cuantos pacientes necesitarán cuidado medico y que tipo de servicio usarán.

En los bancos

La obtención de patrones de preferencia hará que los bancos puedan mejorar la lealtad que tienen sus usuarios hacia ellos. En otras palabras, los datos analizados de las cuentas, transacciones y canales de preferidos se usarán para suplir la necesidad de los clientes de la mejor manera.

El mundo necesita cada vez más especialistas y las técnicas irán cambiando de acuerdo a las necesidades. Si quieres empezar en este fascinante mundo de datos o reciclar conocimientos te recomiendo el curso de fundamentos de bases de datos. Ya lo sabes, ¡La información es dinero!

Néstor Iván

58501Puntos

hace 5 años

Todas sus entradas

Escribe tu comentario

+ 2

Ordenar por:

3

9468Puntos

5 años

buen articulo, sin duda el estudio de la información que nos brindan las bases de datos es una de las cosas mas interesantes. Podrá ser que algún día logremos construir una especie de oráculo griego a partir de nuestra información?Saludos

3

21090Puntos

3 años

que buen articulo!!! gracias!!

2

408Puntos

5 años

Muy interesante, hace tiempo que quería leer acerca, precisamente del Data Mining, buen articulo!!

1

raul.osoriohernandez2013

1936Puntos

2 años

Excellent.
Thank you!

1

madison-eduardo

53305Puntos

2 años

La minería de datos es un mundo super amplio.

¿Cuál es la mejor manera de utilizarlo en la industria de la construcción?

1

4926Puntos

3 años

Me gustaría haber leído algún ejemplo de clustering, pero realmente el artículo es fantástico. Gracias!!

1

8285Puntos

3 años

la información es dinero, excelente frase.

1

1052Puntos

3 años

Bastante completa la información del articulo. Un abrazo.

1

117481Puntos

3 años

Cuanta frescura en este artículo que hace todo tan entendible. Me gusta. Gracias Nestor

1

21090Puntos

3 años

“El mundo necesita cada vez más especialistas y las técnicas irán cambiando de acuerdo a las necesidades.”

Acabo de empezar a estudiar análisis de datos y todo esto me ha encantado!! gracias!!! buen articulo 😃

1

6557Puntos

3 años

Buen aporte. Gracias

0

4027Puntos

4 años

Excelente las técnicas de minería de datos

Entradas relacionadas

16

Qué es PgAdmin4 y cuáles son sus nuevas mejoras

¿Qué es PgAdmin 4? Básicamente es una aplicación gráfica desarrollada con python que implementa las siguientes tecnologías: Flask para

noguerajulioces

noguerajulioces

19

7 razones para usar MongoDB en tus proyectos

Qué es MongoDB Para los que no conocen qué es MongoDB, este es un motor de base de datos NoSQL basado en documentos. Esto quiere decir que

albertramirez

albertramirez

72

MongoDB vs SQL: Di no a la rebeldía. Usa MongoDB con responsabilidad.

MongoDB es más flexible que un espagueti. No nos impone esquemas ni estructuras super definidas. Podemos ser tan desordenados como yo en mi

juandc

juandc

33

Mi historia de amor con PostgreSQL

En la universidad trabajamos en varios proyectos en el que se debía entregar una aplicación web que usara bases de datos, ya sea porque era

Oz