En los diferentes Cloud Providers y en los diferentes servicios que tenemos a nuestra disposición para almacenar información, tenemos una variedad muy grande; por lo cual, debemos tener en cuenta:
- Almacenamiento: Debemos seleccionar el mejor servicio que se ajuste a nuestro proyecto.
- Extracción: Desde el Cloud Provider, nos conectarnos a las distintas fuentes de información y extraemos datos.
- Ingesta: Podemos hacer que una fuente de datos alimente el Cloud, donde previamente debemos escoger servicios que reciban dicha información para posteriormente procesarla.
- Validación: Esta es la validación de la información. Debemos proporcionar algunas caracterÃsticas bien definidas y unas garantÃas para que esa información sea precisa y consistente (debemos garantizar la consistencia de la información).
- Verificación: En esta fase debemos verificar los distintos tipos de datos; debemos enfocarnos en el tipo de dato, su exactitud y que no tenga inconsistencias.
- Tests: Usualmente en este tipo de proyectos, en donde procesamos grandes masas (volúmenes gigantezcos) de información, siempre debemos hacer pruebas sobre un subset de toda la información, tomando un porcentaje de la información, en donde verificamos que nuestro sistema y arquitectura esté trabajando de la forma correcta: transformando bien, extrayendo bien la información, una visualización correcta, etc.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?