Buenas! Espero que esten bien! Les dejo mis apuntes del curso para que puedan acompañarlo! Saludos!
Link: https://jpkitro.notion.site/Analisis-de-negocios-para-ciencia-de-datos-75d5ad9d7ccb4292b7ff029b91ee3cec
-
El mundo de los datos
Big data
Gran volumen de informacion de datos. Las empresas deberian almacenar datos diariamente y asi poder crear una solucion matematica o estadistica a un problema de negocio
Tipologia de datos
- Personas
Infomacion conseguida por las acciones que los humanos realizamos en diferentes situaciones - Transacciones
- Monetarias
Segun nuestros gastos, se puede saber o suponer en que vamos a gastar o que vamos a hacer - No monetarias
Segun nuestras llamadas, mensajes, etc. Podremos saber lo que vamos a hacer o dejar de hacer dependiendo de nuestro comportamiento “normal”
- Monetarias
- Navegacion web
Cookies para saber TODO sobre el usuario en nuestra pagina - Machine 2 machine
De maquina a maquina como el GPS en Google maps cuando queremos saber donde esta un colectivo - Biometricos
Estos datos nos identifican como ser unico (como la huella dactilar) y son tema de debate muy amplio
Crear cultura de datos en una empresa (data driven)
- Crear una cultura de datos
- Recolectar TODO para poder medir
- Medir TODO para poder analizar
- Datos RELEVANTES y PRECISOS
- Testear en base a una hipotesis
- Desde nuestros INSIGHTS de datos a las ACCIONES utilizando estos datos muy bien
- Cumplir las regulaciones de datos (etica de datos)
- Automatizar!
Tipos de IA
- Inteligencia artificial
La capacidad de un ordenador de poder tomar decisiones inteligentes- Machine learning
La capacidad de un ordenador de poder crear y mejorar dicho comportamient mediante entrenamientos automaticos. Al estas ser mas profundas por la complegidad de la red neuronal, se convierte en deep learning- Deep learning
Al ser tan avanzado, puede reconocer imagenes, audio o cosas mas complejas aun, y hasta crearlas en mucho menos tiempo ya que puede trabajar asincronamente
- Deep learning
- Machine learning
Machine learning
- Deteccion de fraudes
- Busqueda web (anuncios)
- Anuncios a tiempo real (anuncios de ultimo momento)
- Analisis de textos
- Next Best Action (apresurarse a cosas que saben q vas a querer hacer)
Deep learning
- Reconocimiento de imagenes extremadamente rapido
- Reconocimiento de sonido en base a increibles procedimientos ante una base de datos como Shazam
- Carros automatizados gracias a video en vivo transformado en 1s y 0s (es mas jugado con la etica)
- Personas
-
Herramientas y roles de trabajo en ciencia de datos
<h1>Flujo de trabajo en ciencia de datos</h1>Roles
Ingeniero de datos
- Arquitecto de la información que vamos a almacenar
- Conexión entre un dispositivo y la base de datos
- Hacen APIs o ETLs y utilizan bases de datos tanto SQL como NoSQL
Analista BI
- Extracción y dashboards a partir de una base de datos ya construida
- Automatización de estos procesos
- Herramientas como SQL y Excel
Data scientist
- Funciona como el analista, pero puede predecir gracias al machine learning
- Modelos estáticos para saber hacia donde vamos
- Herramientas como R y Python sumados a SQL
Data translator
- Puede ser especialista en datos o especialista en negocios, deberá conectar estos dos mundos y poder interpretarlos de la mejor manera
SQL
- Extraccion de informacion
- Sintesis de la base de datos
- Cuadros de control de la operación
- Ejemplo del envudo
R y Python
- Analisis de datos con enfoque estadistico e ingenieril
- Análisis descriptivo y exploratorio
- Librerias como Pandas y Numpy (en Python) y ggplot2 y dplyr (En R)
Comandos
SELECT
Selecion de los campos (Columnas) para hacer el analisis o para sintetizar la tabla de origen
Clausulas
FROM
Tabla donde se almacena la informacion
WHERE
Especificar las condiciones que se aplicaran
GROUP BY
Campos (Columnas) de agrupacion
ORDER BY
Campos (Columnas) de ordenacion
Operadores logicos
AND
Une varias condiciones que tienen que ser cumplidas
OR
Evalua dos o mas condiciones y obtienes resultados si una de ellas se cumple
NOT
Excluye un valor de la información a obtener
Funciones agregadas
AVG
Promedio de una campo
COUNT
Recuento de valores de una columna
DISTINCT
Encontrar valores unicos
SUM
Suma de valores de una columna
MAX
Valor mas alto de una columna
MIN
Valor más bajo de una columna
<h1>Creación de queries en SQL</h1>Ejercicio:
- Saber CUANTAS bocinas hemos vendido por mas de 600 MXN desde 2019
- Tabla en excel: VENTAS_2020
Resultado:
<h1>Conflictos y retos actuales sobre la ética y tratamientos de datos</h1>SELECT COUNT (DISTINCT id) FROM VENTAS_2020 WHERE Producto = 'Bocina' AND Valor > 600 AND Anio => 2019Ética en el procesamiento de imágenes
- Ejemplo de Face-app o Tinder
En una época estuvo de moda la app para ver cómo serías si fueses de distinto generó o con 1 decada mas de edad. Esto se logra gracias a la inmensa cantidad de datos que la empresa tiene sobre las diferentes personas y así puede jugar con estos datos. No es tan divertido que una app tenga tu información desde que naciste hasta lo que podes llegar a hacer en unos dias (Ademas de tener metadatos incluidos en tu cuenta)
-
Problema de negocio: ANALISIS
<h1>Técnicas de storytelling para estructurar el problema en algo lógico</h1>Problema (Hipótesis)
Algunos clientes contactan a soporte en exceso
- No lo podemos identificar
- No podemos prevenir este comportamiento
Solución
Crear un script que identifique y clasifique a los Top Offenders
- Entender sus motivacion - clasificarlos
- Definir acciones para prevenir esta tendencia
Alcance (Lo necesariamente grande con una distinción)
LATAM con distinction por ciudades
- Clientes
- Actualización mensual
<h1>Estructurar un caso de negocio</h1>Hipótesis / Storytelling
Que?
Algunos clientes contactan a soporte en exceso
Por que?
- Motivaciones economicas
- Preguntas
- Problemas tecnologicos
- Politica de empresa
Como?
- Análisis cuantitativo (Siempre)
- Análisis cualitativo
- Matriz cuantitativa - cualitativa (Entendiendo)
- Definir acciones de prevención
- Validacion
<h1>Analisis cuantitativo de un caso de negocio</h1>Descargar información (SQL)
- Clientes con ≥ 1 queja
- Datos por un mes
- Macros por ciudad y mes
Identificar
- Patrones de comportamiento
- Variables significativas
- Madurez (Compras realizadas)
- Quejas mensuales
- Compras mensuales
- Gasto mensual
- Créditos y dinero devuelto (Dinero)
- Margen operativo neto (Ganancias y perdidas)
Definir
- Segmentación según rentabilidad
- Threshold (Límite) top offender
- Threshold para cada categoria
- Clientes regulares
- Clientes bronce
- Clientes plata
- Clientes dorado
Análisis: Mapeo

Hipótesis
A mayor compras, menos compras por entendimiento del sistema.
- Eliminamos los clientes que hicieron menos de diez compras en total y con un alto porcentaje de quejas
Analisis: Aplicacion

Podemos ver que el 20% total de las quejas se concentran en estos usuarios. Son muy pocos usuarios comparados con el total
<h1>Analisis cualitativo de un caso de negocio</h1>Clusterizar:
Causas de contacto
- Motivaciones economicas
- Preguntas
- Problemas tecnologicos
- Politicas de empresa
Clasificar:
Causas de los Top Offenders identificados. Motivos detrás de los mensajes, categorias dentro de categorías leyendo los mensajes y buscando palabras
Profundizar
- Motivos de contacto
- Geolocalización
Análisis: Cauterización

<h1>Fusión cuanti-cualitativa en un caso de negocio</h1>
Con este gráfico podemos ver que nuestros mejores compradores son los que menos quieren una remuneración monetaria, pero es inquietante que tengan problemas tecnológicos y con las políticas de la empresa. Con estos datos podemos ver donde deberíamos ajustar las tuercas y donde reveer nuestros valores
<h1>Minería de texto, información adicional</h1>
Gracias a la minería de texto, podemos entender quienes son nuestros clientes segun los tipos, y podremos ver mas a detalle donde deberíamos cambiar las cosas o mejorarlas.
-
Problemas de negocio: IMPLEMETACION
<h1>Acciones, algoritmos y toma de decisiones post resultados</h1>Algoritmos usados
- Mineria de datos para clasificacion de motivos de contacto
- Correlaciones y patrones de comportamiento
- Arboles de decision y teoria de juegos para predecir y tomar decisiones
- Validación con bayesianos y MCMC
Acciones para disminuir las quejas
- Taggear a los top offenders identificados mensualmente
- Advertirlos
- Llamar usuarios
- Bloquear usuarios
- Validación con A/B Test
-
Los apuntes de Majo
Curso de Análisis de Negocios para Ciencia de Datos
COMPARTE ESTE ARTÍCULO Y MUESTRA LO QUE APRENDISTE



