Actualmente, las necesidades del mercado y las empresas han cambiado totalmente en cuanto a volumen, complejidad, variedad y uso de los datos y por ello los Data Warehouse tradicionales presentan una serie de limitaciones de cara a satisfacer de forma óptima las necesidades actuales del mercado.
El Data Warehouse (Almacén de datos en inglés) nació en la década de los años 80 frente a la creciente necesidad de contar con un sistema de almacenamiento de datos que asegurase el orden, fluidez y fácil manejo de estos y que supusiera un ahorro en términos de coste y tiempo.
Un Data Warehouse es un repositorio unificado en el que se almacenan los datos procedentes de las distintas fuentes que puedan existir en una organización, quedando estos integrados, depurados y ordenados en una única base de datos centralizada. El repositorio puede ser físico o lógico y hace hincapié en la captura de datos de diversas fuentes que deben almacenarse de forma segura, fiable y accesible.
Pero no tenemos que olvidar los DataMarts que consisten en repositorios más pequeños, y cuya diferencia principal con el Data Warehouse es su alcance. El objetivo principal de estos consiste en cubrir las necesidades de un departamento concreto dentro de la compañía.
Actualmente, las necesidades del mercado y las empresas han cambiado totalmente en cuanto a volumen, complejidad, variedad y uso de los datos y por ello los Data Warehouse tradicionales presentan una serie de limitaciones de cara a satisfacer de forma óptima las necesidades actuales de las empresas:
-Son plataformas complejas que precisan de habilidades especiales y muchos reajustes y configuración y todo empeora cuando día a día crecen el número y variedad de fuentes de datos, usuarios y queries.
-A día de hoy, cada vez hay más fuentes de datos y mucho más variadas lo que supone que una gran diversidad de estructuras de datos deben co-existir en una misma localización permitiendo análisis más exhaustivos.
Ampliar las prestaciones de un DWH tradicional es caro y lento
–Ampliar la capacidad de un Data Warehouse tradicional para afrontar las grandes necesidades de almacenamiento y cargas de trabajo, cuando sea posible, es caro y un proceso muy lento.
-En las arquitecturas tradicionales, los usuarios y las actividades de integración de datos compiten entre sí, lo que supone una gran dificultad a la hora de integrar datos y ofrecer un rendimiento óptimo al usuario de forma simultánea.
Por otro lado, los Cloud Data Warehouse, se han desarrollado hasta tal punto que cumplen con todas las crecientes demandas de una economía gobernada por los datos:
El factor clave de la modernización de los Data Warehouses ha sido la Nube
-Un factor clave en la modernización y éxito de los Data Warehouse ha sido la Nube. A través del Cloud se tiene acceso a un casi infinito y económico espacio de almacenaje, una escalabilidad mejorada, se ha externalizado la gestión y seguridad del Data Warehouse al fabricante y se tiene el potencial de pagar solo por el espacio y recursos que realmente se están utilizando.
–Almacenamiento en columnas en detrimento del almacenamiento en filas, lo que suponía tener que leer la fila entera para poder obtener el elemento buscado, sin duda alguna, una tarea ardua y que implicaba demasiado tiempo. Con este método cualquier consulta para analizar esos datos obtiene una rápida respuesta.
-El Procesamiento Vectorizado es una manera de procesar datos de forma mucho más rápida en Data Analytics que se beneficia de los diseños actuales y revolucionarios de los chips de los ordenadores.
-El Procedimiento Masivo en Paralelo se trata de dividir una operación computacional y ejecutarla de forma simultánea en diferentes procesadores. Esto ayuda a agilizar el almacenaje y el análisis de los datos.
– Los Solid State Drives (SSDs) almacenan datos en flash memory chips lo que facilita la rapidez en el almacenaje, análisis y recuperación de estos. Cualquier solución que se aprovecha de este tipo de almacenamiento puede llevar a cabo un rendimiento y funcionamiento espectacular
¿Quién crees que gana el duelo?
Fuentes: Todos los derechos reservados a Snowflake