¿Es realmente la Ciencia de Datos el trabajo más sexy de este siglo? - Carlos Alarcón

Clase 19 de 42Platzi CONF 2022

Contenido del curso

Expert stage

Tech Stage

Business Stage

Creative Stage

Ignites

Resumen

En 2012, Harvard Business School publicó un artículo que lo cambió todo: "Data Scientist: The Sexiest Job of the 21st Century". Desde entonces, la industria de los datos ha crecido de forma explosiva, los perfiles profesionales se han diversificado y la inteligencia artificial ha llegado a terrenos que nadie anticipaba. Pero con nuevos retos en ética, contaminación ambiental y cultura organizacional, vale la pena preguntarse si esa etiqueta de "profesión más sexy" sigue vigente.

¿Por qué se llamó "la profesión más sexy" del siglo XXI?

Todo comenzó cuando Harvard Business School publicó el famoso artículo que describía al científico de datos como un profesional con una combinación única de habilidades: matemáticas, estadística, programación y conocimiento del negocio [0:42]. Esa mezcla era tan rara que estas personas fueron llamadas unicornios, representadas en un popular diagrama de Venn donde la intersección de todas esas competencias daba como resultado un "supernerd" [2:04].

El término sexy no se refería a la apariencia, sino a poseer habilidades extrañas y escasas con una demanda altísima [2:38]. Pocos profesionales reunían todos los requisitos y las empresas los necesitaban con urgencia, lo que disparó los salarios y la atención mediática.

¿Qué dicen los datos sobre la demanda actual?

La materia prima no es problema. Para 2025 se proyectan ciento ochenta y un zettabytes de datos generados en el mundo, donde un solo zettabyte equivale a mil millones de terabytes [3:22]. La demanda de roles relacionados con datos sigue en aumento constante.

El World Economic Forum publicó en 2020 su listado de profesiones con mayor crecimiento global, y el top tres está directamente vinculado a la economía de los datos [3:56]:

  • Data analyst y data scientist.
  • Especialistas en inteligencia artificial y machine learning.
  • Especialistas en big data.

En Latinoamérica, LinkedIn reportó un crecimiento del 68 % en vacantes de ciencia de datos en México, con un dato preocupante: solo el 18 % de quienes aplicaron fueron mujeres [4:32].

¿Cómo están los salarios en esta industria?

En Estados Unidos, la media salarial ronda los 121 000 dólares anuales, con un tope de 263 000 dólares [5:02]. En Colombia, el promedio anual se ubica cerca de los 88 o 89 millones de pesos, superando por amplio margen roles como front end (52 millones) o backend (50 millones) [5:16].

¿Cómo se diversificó la profesión en diez años?

Ya no se busca al unicornio que lo haga todo. Hoy existen múltiples perfiles especializados: analista de datos, científico de datos, arquitecto de datos, ingeniero de datos, entre otros [5:55]. Cada rol resuelve una necesidad específica de la empresa, y la buena noticia es que se pagan igual o mejor que el científico de datos original.

La oferta educativa también explotó. Universidades ofrecen pregrados y posgrados, existen bootcamps, talleres y plataformas con escuelas dedicadas a los cuatro perfiles más demandados: científico de datos, analista de datos, data engineer y machine learning engineer [6:28].

Herramientas como AutoML permiten entrenar un modelo con pocos clics, saltando parte de la estadística y la programación [7:07]. Mientras tanto, MLOps ha surgido como una profesión completa que automatiza la evaluación, monitoreo, despliegue y reentrenamiento de modelos [7:30].

¿Qué retos enfrenta hoy la inteligencia artificial?

Hace algunos años, Kai-Fu Lee aseguraba que la inteligencia artificial podía optimizar pero no crear [7:55]. Herramientas como DALL-E 2, Midjourney y Stable Diffusion han desafiado esa premisa generando imágenes originales e incluso portadas profesionales [8:32]. En procesamiento de lenguaje natural, modelos capaces de escribir cuentos, copies de marketing y sostener conversaciones tan realistas que confunden a sus propios ingenieros [9:00].

¿Cuál es el costo ambiental y ético?

Entrenar un modelo de 213 millones de parámetros genera cinco veces más CO₂ que toda la vida útil de un automóvil en Estados Unidos [9:55]. GPT-3 tiene 175 mil millones de parámetros y PaLM de Google alcanza los 540 mil millones, multiplicando ese impacto ambiental.

En el plano ético, el caso Cambridge Analytica demostró cómo el análisis de datos en redes sociales puede sugestionar elecciones presidenciales [10:30]. Algoritmos entrenados con datos de Internet heredan sesgos que castigan a personas por género, etnia o ideología. Iniciativas como la Liga de la Justicia Algorítmica permiten denunciar estos problemas y trabajar para prevenirlos [10:50].

¿Por qué muchas organizaciones fracasan con los datos?

No basta con contratar un equipo de datos y esperar resultados mágicos. Las organizaciones deben transformar sus procesos y funciones para girar alrededor de los datos [11:18]. Sin esa transformación cultural, ocurre lo típico: se crea un dashboard que nadie consulta y las decisiones siguen basándose en la intuición.

Además, la limpieza de datos sigue consumiendo entre el 65 y el 70 % del tiempo de trabajo [12:00]. Después de diez años, los profesionales siguen dedicando la mayor parte de su jornada no a crear modelos ni a generar valor, sino a preparar la información.

Con todos estos datos sobre la mesa, la respuesta a si sigue siendo la profesión más sexy queda abierta. Lo que resulta indiscutible es que la economía de los datos sigue creciendo, los perfiles se multiplican y los retos éticos y ambientales exigen profesionales cada vez más preparados. ¿Tú qué opinas? Comparte tu perspectiva en los comentarios.