Lake Formation: Automatización y Seguridad en Gestión de Data Lakes

Clase 40 de 52Curso de Big Data en AWS

Resumen

Este servicio aún no se encuentra disponible al público, pero cuenta con grandes características:

  • Facilita y permite la creación de data lake en cuestión de días.
  • Tiene integración con diferentes fuentes usando JDBC.
  • Va a ejecutar Crawlers.
  • Te va a ayudar con los ETL.
  • Limpia y elimina data duplicada utilizando FindMatch.
  • Optimiza las particiones de S3.
  • Control de permisos por usuario por bases de datos, tablas y columnas.
  • Se puede asignar data owners para control de permisos.
  • Analytics desde otros servicios como EMR y RedShift.