¿Por qué correr cargas de Machine Learning en la nube?

3/28
Recursos
Transcripción

Hoy en día estamos generando más datos que cualquier otro en la historia y no solo los utilizamos para uso personal. Actualmente interactuamos en texto, voz y vídeo.

Un teraflops es una unidad de velocidad de cómputo.

ResNet y TensorFlow utilizado para la clasificación de imágenes. Con un TPUv2 :

  • Se lograba procesar 4100img/sec
  • Precisión Final: 93%
  • Entrenamiento; 7h 47m
  • Costro de entrenamineto: 36$
  • Costo de entrenamiento(preemptible): 11$

ResNet y TensorFlow con TPU v2 pod alpha:

  • Se logró procesar 219k+img/sec
  • Una precisión final de 93%
  • Entrenamiento 8m 45s

Aportes 15

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Muy interesante el dato de las imágenes que se pueden llegar a procesar:

219,000 imágenes por segundo.

Ahora entiendo porque se comienza a hablar de partículas subatómicas y computación cuántica, un futuro promisorio

Un TERAFLOP se refiere a la capacidad de un procesador para calcular un billón de operaciones de punto flotante por segundo (1’000,000,000,000 operaciones/seg).

Mega-FLOPS = MFLOPS = 10^6
Giga-FLOPS = GFLOPS = 10^9
Tera-FLOPS = TFLOPS = 10^12

La infrastructure puede ser muy complicada, mejor compra google jajajajaja

  • la linea de la ley de moore se aplano, es decir que debemos esperar aproximadamente 18 meses para duplicar la velocidad de procesamiento.
  • Estamos generando gran cantidad de datos. Crecimiento de necesidad de computo.
  • TPU : Unidad de Procesamiento Tensorial
  • El desarrollo e investigación de ML esta llegando a niveles interactivos, la velocidad de procesamiento con hardware TPU hace que los entrenamientos sean muy rápidos.
  • promesas de la nube: Rápido, a escala, buen precio, no hay que casarse con una nube (puedes migrar tu modelo a cualquiera y siempre habrá compatibilidad.)

Consultando un poco el tiempo de la ley de Moore son 24 meses y no 18 meses
https://hardzone.es/reportajes/que-es/ley-de-moore/

Muy interesante todo esto de las TPU, la verdad desconocía todo lo que el imperio de Google ha creado y mejor aún seguirá creando y mejorando. Es genial!!

Crecimiento exponencial muy acelerado, estamos en la IA.

Muy interesante procesar mucha información en tan poco tiempo.

Mantener equipos que permitan trabajar efectivamente com ML es muy costoso para las empresas. Por eso utilizar servicios en la nube es apropiado, sobre todo cuando se trabaja con grandes cantidades de datos.

Hay que dejarle los fierros a los Ing. de DevOps y redes, jejeje.

Hoy se usa ML hasta para diseñar Hardware.