Migración de Datos a AWS con DataSync

Clase 72 de 80Curso AWS Cloud Practitioner Certification

Contenido del curso

Fundamentos de la Infraestructura Global de AWS

Servicios de cómputo en AWS

Almacenamiento en AWS

Seguridad en AWS

Costos en AWS

Cómo aprobar la certificación AWS Cloud Practitioner

Resumen

Cuando se trata de mover datos desde un entorno on premise hacia la nube de AWS, existe un servicio diseñado específicamente para simplificar ese proceso. AWS DataSync es una herramienta de transferencia y descubrimiento de datos que resulta fundamental tanto en escenarios reales como en el examen de certificación.

¿Qué es AWS DataSync y por qué es tan relevante?

DataSync es un servicio que combina dos capacidades principales: descubrir los datos que existen en tu infraestructura local y migrarlos de forma eficiente hacia AWS. A diferencia de otros servicios que pueden parecer similares, DataSync se distingue por su enfoque integral en el proceso de migración.

El servicio analiza los datos que tienes on premise, identifica su estructura y, con base en esa información, te ayuda a planificar y ejecutar la transferencia hacia la nube. Esto lo convierte en una solución optimizada para que los procesos de migración sean mucho más rápidos y eficientes [01:10].

¿Cómo diferenciarlo de la familia Snow y Storage Gateway?

Dentro del ecosistema de AWS existen varios servicios relacionados con la transferencia de datos: la familia Snow (Snowball, Snowcone, Snowmobile), Storage Gateway y DataSync. Al presentar el examen, es muy probable que aparezcan estos tres como opciones en una misma pregunta [00:47].

La clave para distinguirlos está en entender las capacidades específicas de DataSync:

  • Descubrimiento de datos: DataSync puede analizar y entender qué datos tienes en tu entorno local antes de migrarlos.
  • Compatibilidad amplia: soporta diferentes sistemas de archivos on premise como NFS, SMB, Hadoop y almacenamiento por objetos [01:10].
  • Optimización de transferencia: está diseñado para que el proceso de migración sea lo más eficiente posible.

Mientras la familia Snow se enfoca en transferencias físicas de grandes volúmenes y Storage Gateway en almacenamiento híbrido, DataSync se centra en la migración y replicación de datos a través de la red.

¿DataSync solo sirve para migrar datos?

No. Además de la migración, DataSync permite un escenario muy valioso: la replicación de datos para disaster recovery. En este caso, los datos se copian desde el entorno on premise hacia AWS, pero se mantienen también en la infraestructura local [01:42].

¿Cómo funciona la replicación?

La idea es sencilla: si ocurre un problema en tu infraestructura local, ya cuentas con una copia de tus datos en la nube de AWS. No se trata de mover los datos y eliminarlos del origen, sino de mantener ambas copias sincronizadas como estrategia de protección.

¿Cuándo pensar en DataSync?

Cada vez que una pregunta o un escenario mencione migración de datos hacia la nube de AWS, la respuesta más probable es DataSync. Este es el servicio que AWS recomienda para transferencias de datos desde entornos locales hacia servicios de almacenamiento en la nube [02:05].

En resumen, los tres escenarios principales de uso son:

  • Migración completa de datos on premise a AWS.
  • Replicación para disaster recovery, manteniendo los datos en ambos entornos.
  • Descubrimiento de datos locales para planificar la estrategia de migración.

Si estás preparándote para la certificación, recuerda siempre asociar DataSync con la migración eficiente de datos y su capacidad de trabajar con múltiples sistemas de archivos. ¿Tienes dudas sobre cómo se compara con otros servicios de transferencia? Comparte tu experiencia en los comentarios.