1

Notas para ACOMPAÑAR al curso

Buenas! Espero que esten bien! Les dejo mis apuntes del curso para que puedan acompañarlo! Saludos!
Link: https://jpkitro.notion.site/Analisis-de-negocios-para-ciencia-de-datos-75d5ad9d7ccb4292b7ff029b91ee3cec

  • El mundo de los datos

    Big data

    Gran volumen de informacion de datos. Las empresas deberian almacenar datos diariamente y asi poder crear una solucion matematica o estadistica a un problema de negocio

    Tipologia de datos

    • Personas
      Infomacion conseguida por las acciones que los humanos realizamos en diferentes situaciones
    • Transacciones
      • Monetarias
        Segun nuestros gastos, se puede saber o suponer en que vamos a gastar o que vamos a hacer
      • No monetarias
        Segun nuestras llamadas, mensajes, etc. Podremos saber lo que vamos a hacer o dejar de hacer dependiendo de nuestro comportamiento “normal”
    • Navegacion web
      Cookies para saber TODO sobre el usuario en nuestra pagina
    • Machine 2 machine
      De maquina a maquina como el GPS en Google maps cuando queremos saber donde esta un colectivo
    • Biometricos
      Estos datos nos identifican como ser unico (como la huella dactilar) y son tema de debate muy amplio

    Crear cultura de datos en una empresa (data driven)

    1. Crear una cultura de datos
    2. Recolectar TODO para poder medir
    3. Medir TODO para poder analizar
    4. Datos RELEVANTES y PRECISOS
    5. Testear en base a una hipotesis
    6. Desde nuestros INSIGHTS de datos a las ACCIONES utilizando estos datos muy bien
    7. Cumplir las regulaciones de datos (etica de datos)
    8. Automatizar!

    Tipos de IA

    • Inteligencia artificial
      La capacidad de un ordenador de poder tomar decisiones inteligentes
      • Machine learning
        La capacidad de un ordenador de poder crear y mejorar dicho comportamient mediante entrenamientos automaticos. Al estas ser mas profundas por la complegidad de la red neuronal, se convierte en deep learning
        • Deep learning
          Al ser tan avanzado, puede reconocer imagenes, audio o cosas mas complejas aun, y hasta crearlas en mucho menos tiempo ya que puede trabajar asincronamente

    Machine learning

    • Deteccion de fraudes
    • Busqueda web (anuncios)
    • Anuncios a tiempo real (anuncios de ultimo momento)
    • Analisis de textos
    • Next Best Action (apresurarse a cosas que saben q vas a querer hacer)

    Deep learning

    • Reconocimiento de imagenes extremadamente rapido
    • Reconocimiento de sonido en base a increibles procedimientos ante una base de datos como Shazam
    • Carros automatizados gracias a video en vivo transformado en 1s y 0s (es mas jugado con la etica)
  • Herramientas y roles de trabajo en ciencia de datos

    <h1>Flujo de trabajo en ciencia de datos</h1>

    Roles

    Ingeniero de datos

    • Arquitecto de la información que vamos a almacenar
    • Conexión entre un dispositivo y la base de datos
    • Hacen APIs o ETLs y utilizan bases de datos tanto SQL como NoSQL

    Analista BI

    • Extracción y dashboards a partir de una base de datos ya construida
    • Automatización de estos procesos
    • Herramientas como SQL y Excel

    Data scientist

    • Funciona como el analista, pero puede predecir gracias al machine learning
    • Modelos estáticos para saber hacia donde vamos
    • Herramientas como R y Python sumados a SQL

    Data translator

    • Puede ser especialista en datos o especialista en negocios, deberá conectar estos dos mundos y poder interpretarlos de la mejor manera
    <h1>Herramientas por etapas</h1>

    SQL

    • Extraccion de informacion
    • Sintesis de la base de datos
    • Cuadros de control de la operación
    • Ejemplo del envudo

    R y Python

    • Analisis de datos con enfoque estadistico e ingenieril
    • Análisis descriptivo y exploratorio
    • Librerias como Pandas y Numpy (en Python) y ggplot2 y dplyr (En R)
    <h1>Lo basico de SQL</h1>

    Comandos

    SELECT

    Selecion de los campos (Columnas) para hacer el analisis o para sintetizar la tabla de origen

    Clausulas

    FROM

    Tabla donde se almacena la informacion

    WHERE

    Especificar las condiciones que se aplicaran

    GROUP BY

    Campos (Columnas) de agrupacion

    ORDER BY

    Campos (Columnas) de ordenacion

    Operadores logicos

    AND

    Une varias condiciones que tienen que ser cumplidas

    OR

    Evalua dos o mas condiciones y obtienes resultados si una de ellas se cumple

    NOT

    Excluye un valor de la información a obtener

    Funciones agregadas

    AVG

    Promedio de una campo

    COUNT

    Recuento de valores de una columna

    DISTINCT

    Encontrar valores unicos

    SUM

    Suma de valores de una columna

    MAX

    Valor mas alto de una columna

    MIN

    Valor más bajo de una columna

    <h1>Creación de queries en SQL</h1>

    Ejercicio:

    • Saber CUANTAS bocinas hemos vendido por mas de 600 MXN desde 2019
    • Tabla en excel: VENTAS_2020

    Resultado:

    SELECTCOUNT (DISTINCTid) FROM VENTAS_2020 
    WHERE Producto = 'Bocina'AND Valor > 600AND Anio => 2019
    <h1>Conflictos y retos actuales sobre la ética y tratamientos de datos</h1>

    Ética en el procesamiento de imágenes

    • Ejemplo de Face-app o Tinder
      En una época estuvo de moda la app para ver cómo serías si fueses de distinto generó o con 1 decada mas de edad. Esto se logra gracias a la inmensa cantidad de datos que la empresa tiene sobre las diferentes personas y así puede jugar con estos datos. No es tan divertido que una app tenga tu información desde que naciste hasta lo que podes llegar a hacer en unos dias (Ademas de tener metadatos incluidos en tu cuenta)
  • Problema de negocio: ANALISIS

    <h1>Técnicas de storytelling para estructurar el problema en algo lógico</h1>

    Problema (Hipótesis)

    Algunos clientes contactan a soporte en exceso

    • No lo podemos identificar
    • No podemos prevenir este comportamiento

    Solución

    Crear un script que identifique y clasifique a los Top Offenders

    • Entender sus motivacion - clasificarlos
    • Definir acciones para prevenir esta tendencia

    Alcance (Lo necesariamente grande con una distinción)

    LATAM con distinction por ciudades

    • Clientes
    • Actualización mensual

    <h1>Estructurar un caso de negocio</h1>

    Hipótesis / Storytelling

    Que?

    Algunos clientes contactan a soporte en exceso

    Por que?

    • Motivaciones economicas
    • Preguntas
    • Problemas tecnologicos
    • Politica de empresa

    Como?

    • Análisis cuantitativo (Siempre)
    • Análisis cualitativo
    • Matriz cuantitativa - cualitativa (Entendiendo)
    • Definir acciones de prevención
    • Validacion

    <h1>Analisis cuantitativo de un caso de negocio</h1>

    Descargar información (SQL)

    • Clientes con ≥ 1 queja
    • Datos por un mes
    • Macros por ciudad y mes

    Identificar

    • Patrones de comportamiento
    • Variables significativas
      • Madurez (Compras realizadas)
      • Quejas mensuales
      • Compras mensuales
      • Gasto mensual
      • Créditos y dinero devuelto (Dinero)
      • Margen operativo neto (Ganancias y perdidas)

    Definir

    • Segmentación según rentabilidad
    • Threshold (Límite) top offender
    • Threshold para cada categoria
      • Clientes regulares
      • Clientes bronce
      • Clientes plata
      • Clientes dorado

    Análisis: Mapeo

    Untitled

    Hipótesis

    A mayor compras, menos compras por entendimiento del sistema.

    • Eliminamos los clientes que hicieron menos de diez compras en total y con un alto porcentaje de quejas

    Analisis: Aplicacion

    Untitled

    Podemos ver que el 20% total de las quejas se concentran en estos usuarios. Son muy pocos usuarios comparados con el total


    <h1>Analisis cualitativo de un caso de negocio</h1>

    Clusterizar:

    Causas de contacto

    • Motivaciones economicas
    • Preguntas
    • Problemas tecnologicos
    • Politicas de empresa

    Clasificar:

    Causas de los Top Offenders identificados. Motivos detrás de los mensajes, categorias dentro de categorías leyendo los mensajes y buscando palabras

    Profundizar

    • Motivos de contacto
    • Geolocalización

    Análisis: Cauterización

    Untitled

    <h1>Fusión cuanti-cualitativa en un caso de negocio</h1>
    Untitled

    Con este gráfico podemos ver que nuestros mejores compradores son los que menos quieren una remuneración monetaria, pero es inquietante que tengan problemas tecnológicos y con las políticas de la empresa. Con estos datos podemos ver donde deberíamos ajustar las tuercas y donde reveer nuestros valores


    <h1>Minería de texto, información adicional</h1>
    Untitled

    Gracias a la minería de texto, podemos entender quienes son nuestros clientes segun los tipos, y podremos ver mas a detalle donde deberíamos cambiar las cosas o mejorarlas.

  • Problemas de negocio: IMPLEMETACION

    <h1>Acciones, algoritmos y toma de decisiones post resultados</h1>

    Algoritmos usados

    1. Mineria de datos para clasificacion de motivos de contacto
    2. Correlaciones y patrones de comportamiento
    3. Arboles de decision y teoria de juegos para predecir y tomar decisiones
    4. Validación con bayesianos y MCMC

    Acciones para disminuir las quejas

    1. Taggear a los top offenders identificados mensualmente
    2. Advertirlos
    3. Llamar usuarios
    4. Bloquear usuarios
    5. Validación con A/B Test
  • Los apuntes de Majo

    https://static.platzi.com/media/public/uploads/analisisdenegocios_4de948ab-cf57-47f9-8f63-a679c6706b8a.pdf

Escribe tu comentario
+ 2