22

5 tendencias en Ciencia de Datos para 2020

2583Puntos

hace 3 meses

Curso Profesional de Ciencia de Datos
Curso Profesional de Ciencia de Datos

Curso Profesional de Ciencia de Datos

Implementa un flujo profesional de ciencia de datos. Recolecta datos con web scraping y R, procésalos y analízalos con el algoritmo K-means. Conecta los datos a una webapp utilizando una API con plumber y genera informes interactivos con Shiny.

Bienvenidos al futuro. El equipo de Data Science de Platzi se reunió para discutir cuáles serán las 5 tendencias en Ciencia de Datos en 2020. Según su conocimiento y los estudios más relevantes del sector, llegaron a este listado de innovaciones que determinarán el futuro de los empleos en la región, los negocios y el desarrollo de productos:

1. Inteligencia Artificial autónoma:

Su mayor aplicación se conoce como self-driving que consigue que los automóviles no necesiten de conductor. Maravilloso para quienes hacen largos trayectos y pueden aprovechar el tiempo dentro del automóvil mientras este se conduce solo.

Técnicamente, los algoritmos son capaces de recibir muchas variables del entorno en tiempo real y con ello procesa respuestas en tiempo real. Es decir, reconoce las vías, los semáforos y las señales de tránsito. Esta es una de las mayores aplicaciones de la IA Autónoma y que moverá más la economía. En 2020 empresas como Google, Tesla, Uber van a profundizar en sus algoritmos para mejorar esta tecnología.

Quienes estudien Data Science podrán ser buscado por el mismísimo Elon Musk o por otras empresas que estén buscando crecer (¿qué empresa no quiere crecer?) Aunque a la IA Autónoma aún le falta madurar, cuando lo haga todos van a querer adaptarla. Otro dato: En la milicia también se están haciendo desarrollos importantes con drones autónomos.

2. Edge computing:

Con esta tecnología se busca democratizar el Machine Learning. Partamos de lo siguiente: entrenar un modelo es costoso. Debe tener una máquina e infraestructura con un precio muy alto. Ahora se están creando procesadores que no necesiten conexión a una nube. El Edge Computing permite que se construyan modelos “light” que se puedan entrenar desde el propio dispositivo. Dispositivos pequeños que consumen poco y que se pueden entrenar más fácil.
Se pueden construir modelos que no necesiten recursos muy costosos que estén diseñados para entrenarse en los mismos dispositivos. Por ejemplo, Apple ya está usando esa tecnología, que se puedan entrenar modelos desde tu celular. Esto permite cerrar la brecha en capacidad de cómputo y aplicar IA mucho más fácil, más práctico y más barato. Algoritmos baratos y más eficientes, por lo tanto más escalables.

3. Reconocimiento facial:

El futuro ha llegado. La tecnología para pagar con tu rostro está a la vuelta de la esquina. A nuestros países aún no sabemos si suceda para el 2020, pero lo que sí es que la identificación registro facial podría ser un hecho para uso de seguridad. La tecnología podría ser usada en calles y aeropuertos con cámaras que reconozca caras, gestos y emociones. ¿qué quiere decir lo de las emociones? Se refiere a entrenar a las máquinas para que reconozcan los nervios en un aeropuerto, por ejemplo. Sí, apocalíptico y muy al estilo de 1984 de Orson Wells. Aún es un desarrollo que no está tan maduro, pero para 2020 es un tema que se seguirá trabajando fuertemente porque involucra un tema muy grande.

4. GANs:

De todas las cosas que tiene la Ciencia de Datos, esta es fascinante y muy próxima a todos porque este año muchos la usamos. Las GANs son redes generadoras adversarias. En lenguaje común quiere decir que ponen a competir dos redes neuronales. Primero una red generadora aprende a replicar información (imágenes, sonidos, videos) para intentar engañar a otra red generadora discriminadora, cuyo objetivo es no dejarse engañar. Así se juega a que una red cree imágenes artificiales que parezcan reales y el propósito de la otra red es no dejarse engañar para que aprenda a discriminar cuando algo no es real. Y en ese proceso de competir una con otra producen imágenes que son realistas.

Un ejemplo son los deepfakes, que con solo una foto estática pasa por un algoritmo y crea un video con esa imagen hablando. Eso lo hicieron con un falso discurso de Obama, reales engañar a la otra.
La aplicación de envejecimiento que casi todos usamos (admítelo) son el resultado de las GANs.

Sin embargo los deepfakes se están convirtiendo en un gran problema en el mundo de la tecnología. Miles de escándalos falsos han estado circulando en la prensa por múltiples razones y ya no solo apuntan a personas famosas. Ahora las falsificaciones están invadiendo la venganza personal mientras apuntan a personas que no tienen acceso a abogados y equipos legales que pueden llevar a cabo su batalla legal.

En marketing las GANs son usadas para generar una imagen realista con algún tipo de ropa, alguna pose o son el resultado de la imagen del modelo ideal (¿será el fin del modelaje?).

Además esto no solo ha quedado en las imágenes, también ha pasado a las imitaciones de voz con una secuencia de texto. En 2020 se seguirá explorando aún más, perfeccionando porque la resolución aún no es la ideal y se espera que se empiece a comercializar.

Ante el impacto y los problemas que podrían generar las DeepFakes, DARPA, La Agencia de Proyectos de Investigación Avanzada de Defensa del Departamento de Defensa de los Estados Unidos (responsable del desarrollo de tecnologías emergentes para uso militar) va a invertir en probar y encontrar cosas que son DeepFake. Crearán algoritmos para detectar cuándo el contenido es artificial.

5. Procesamiento de lenguaje natural:

Ojo periodistas. Cada vez las máquinas son mejores en la tendencia de leer y generar artículos falsos y de suplantación. Hay máquinas que pueden escribir textos para nosotros y lo que más preocupa es la producción de contenidos falsos en redes sociales. Para 2020 podría seguir siendo un problema.
Sin embargo, el laboratorio Open AI, fundado por Elon Musk, con el objetivo de crear Inteligencia Artificial éticamente responsable. Con el propósito de asegurarse de que se le va a dar un buen uso al desarrollo que ellos hacen.
Así que ellos crearon un algoritmo llamado GPT2 y resultó siendo tan bueno, en las tareas de procesamiento de lenguaje natural que no lo liberaron Open Source. Lo dejaron confidencial y dijeron que se podría convertir en un arma.


Empieza tu carrera en Big Data y Ciencia de Datos con Platzi. Aprenderás a diseñar procesos para extraer, clasificar y procesar grandes cantidades de información que puedes usar para darle valor a estructuras y fuentes de datos. Toma decisiones de negocios usando Data Science.

Curso Profesional de Ciencia de Datos
Curso Profesional de Ciencia de Datos

Curso Profesional de Ciencia de Datos

Implementa un flujo profesional de ciencia de datos. Recolecta datos con web scraping y R, procésalos y analízalos con el algoritmo K-means. Conecta los datos a una webapp utilizando una API con plumber y genera informes interactivos con Shiny.
Ingrid
Ingrid
@ingridzuniga

2583Puntos

hace 3 meses

Todas sus entradas
Escribe tu comentario
+ 2
Ordenar por:
3
2472Puntos

Hay algún curso en Platzi que profundice en GAN’s??

2
9396Puntos

Me quedan unos pocos cursos de la ruta de Inteligencia Artificial y luego tomaré la ruta de Ciencia de Datos (Si, se que debí tomarlo al revés pero bueno ya que estamos) es un tema sumamente interesante y sin duda es el futuro del rubro.

PD: Me imagino cuán orgulloso estaría Freddy si alguno llegara a la empresa de su padrino de bodas aka Elon Musk gracias a Platzi (Lo cuál es completamente posible)

1
107Puntos

I want you to thank you for taking the time to write such a great article! I certainly enjoy every bit of it and I have bookmarked your page to check out your blog’s new stuff.
vex 3

1
2366Puntos

Muy interesante 😦 yo estoy esperando que saquen mas cursos para big data y marketing

1
2441Puntos

Interesante