Importancia de definir el problema en Machine Learning

Clase 2 de 32Curso de Machine Learning Aplicado con Python

Resumen

Errores comunes que se ven cuando no se define bien el problema y se comienza a codear:

  • No hay problemas por resolver.
  • Existen soluciones más simples.
  • No se puede medir el impacto del modelo.
  • No se sabe si el problema ya ha sido resuelto antes.
  • El problema es imposible de resolver.

Preguntas clave para reconocer el tipo de aprendizaje que se necesita:

  • ¿Qué beneficio se puede generar y para quién?
  • ¿Cuál de las siguientes funcionalidades sería más útil para lograr el objetivo?

a) Predecir alguna métrica (Aprendizaje supervisado)
b) Predecir una etiqueta (Aprendizaje supervisado)
c) Agrupar elementos similares.
d) Optimizar un proceso con prueba y error.

Preguntas clave para aterrizar el problema de aprendizaje supervisado:

  • ¿De qué tipo es el valor que se quiere predecir?

a) Continuo
b) Discreto

  • ¿Cuál es la definición de éxito en una predicción?
  • ¿Con qué datos se contaría para hacer esa predicción?
  • ¿La pregunta que se está tratando de resolver pertenece a alguna disciplina en particular?
  • Considerando nuestra intuición en la disciplina ¿Los datos nos permiten predecir el objetivo?