La piedra angular de todo, la característica más importante y auténtico MUST de las características que tiene que tener un Data Warehouse moderno es el Cloud. La innovación tecnológica mejora día a día el Data Warehousing y el Análisis de Datos en términos de simplicidad, rendimiento o costes.
El problema que surge en torno a tanta innovación e información es que nadie tiene claro qué debe tener una plataforma de Data Warehouse para estar a la última en cuanto a modernidad e innovación se refiere:
La piedra angular de todo, la característica más importante y auténtico MUST de las características que tiene que tener un Data Warehouse moderno es el Cloud.
–Recursos Ilimitados: Una infraestructura en la nube nos brinda recursos casi ilimitados en minutos o segundos. Y una de las claves de esta característica es que las empresas pagan por lo que usan por lo que soporta de forma natural cualquier aumento de usuarios o cargas de trabajo sin comprometer su funcionamiento.
–Ahorro de costes: Una empresa que elige una solución en Cloud se ahorra el coste del hardware, software, mantenimiento, actualización y seguridad de los sistemas on-premise. Tan solo se dedicará a Analizar Datos.
El 80% de los datos que se analizan provienen de fuentes externas al Data Center
–Punto natural de integración: Según se estima, el 80% de los datos que se analizan provienen de fuentes externas al Data Center de la empresa. Juntar todos estos datos en la nube es absolutamente más fácil y económico que juntarlos todos en un Data Center interno.
Otra característica a tener en cuenta es el Almacenamiento en Columnas dado que supone una mejora en la eficiencia y el desempeño del almacenaje, recuperación y Análisis de los Datos lo que conlleva un acceso rápido a todos los resultados.
Solid State Drives (SSDs), aceleran el almacenaje, recuperación y Análisis de Datos lo que conlleva a aumentar el poder de computación de la arquitectura de los Data Warehouses.
Un DWH moderno debe estar habilitado para noSQL
Por último, hablaremos sobre la estructura de los datos. Un Data Warehouse moderno debe estar habilitado para noSQL que significa: Not only structured query language (SQL). Gracias a esta tecnología punta se pueden analizar y almacenar nuevas estructuras de datos, como los que provienen de redes sociales o máquinas (IoT). Un Data Warehouse tradicional no está preparado para tratar con tanta variedad de datos por lo que en los últimos años han surgido nuevos programas para poder abordar estos datos semi-estructurados como JSON, Avro o XML.
Para sacar el máximo valor posible a estos datos semi-estructurados, las compañías tenían que extraerlos y transformarlos para que los usuarios pudieran acceder a ellos en el Data Warehouse tradicional, por lo que el proceso se complicaba tanto económicamente como a nivel de dificultad.
Un sistema de Data Warehouse moderno tiene que estar preparado para trabajar tanto con datos estructurados (tradicionales) como datos semi-estructurados lo que supone un ahorro de tiempo y dinero al no tener que pagar y gestionar dos sistemas diferentes.
¿Opinas que una plataforma Cloud es fundamental a día de hoy o por el contrario piensas que los sistemas on-premises tradicionales son suficientes?
Fuente: Todos los derechos reservado a SnowFlake