Big Data es un término que estarás habituado a escuchar en los medios cuando hablan de tecnologías punteras, de palabras de moda o últimamente lo vemos muy relacionado con la estrenada expresión “la nueva normalidad”. (Voz de presentador de anuncio): “Con la nueva normalidad, las empresas necesitan el Big Data ahora más que nunca” “El Big Data se presenta como gran aliado justo ahora que se necesita analizar tantos y tantos y tantos y tantos y tantos datos”.
Mmmmmmmm, el small, casi Big o Big Data del todo, del que se habla ahora es el Data Analytics de toda la vida pero teniendo la capacidad de analizar grandes volúmenes de datos de forma segura, eficiente y sobre todo, escalable.
Ya lleva tiempo con nosotros y la necesidad siempre ha existido. Sin embargo, durante estos últimos meses muchas empresas se han mentalizado y han reconocido que sus datos son uno de sus activos más importantes y que aprovecharlos es clave en su estrategia a partir de ahora, no solo para despuntar en el mercado, si no para sobrevivir.
En el momento de hablar de Big Data no es raro que aparezca el típico tema de las «V´s» para definir las características de esta tecnología.
¿Cuántas son? Unos dicen que 3, otros 5 e incluso últimamente se atreven a lanzar 10. Siempre aparece una nueva “V”, que en definitiva lo que hace es reforzar el discurso de las anteriores.
Por aquí os dejo algunas:
-Volumen, capacidad de analizar grandes volúmenes de datos.
-Velocidad, mucha rapidez a la hora de recibir y tratar los datos.
-Variedad de datos.
-Veracidad, se refiere a la exactitud de los datos.
-Valor, consigue quedarse con los datos de valor para tomar decisiones.
-Variabilidad, capacidad de utilizar los datos en diferentes ocasiones para diferentes fines.
Como persona de negocio, CEO o director de tu área te interesa abrazar el Big Data desde una perspectiva de analítica de negocio, pero resulta interesante, y te lo recomiendo totalmente, conocer la foto general de cómo funciona tecnológicamente el Big Data:
Podríamos decir que se divide en dos ámbitos. Por un lado, la parte meramente tecnológica se encarga del desarrollo de software, configuración y mantenimiento de la arquitectura de la plataforma en cuestión (Hadoop, Spark, etc.) Y por otro, tenemos la parte de analítica que se encarga de la explotación de esos datos (R, Phyton, etc.)
Ya lo decían Julio César, Napoléon o Sun Tzu: «Divide y vencerás».
¿Quiénes somos nosotros para contradecir a estas celebridades y expertos en el arte de la guerra? El Big Data tomó buena cuenta de ello y utiliza la misma estrategia para analizar grandes volúmenes de datos: dividir y paralelizar.
Divide la gran tarea en otras más pequeñitas y asigna de forma paralela y escalable esas nuevas tareas a diferentes máquinas encargadas de procesarlas.
Con este ejemplo sacado del libro «Big Data para CEOS y Directores de Marketing» lo comprenderás a la perfección:
Supongamos que eres dueño/a del Gran Hotel Caribean en Tenerife que cuenta con 25 habitaciones, para las cuales tienes una limpiadora que tarda 18 minutos en limpiar cada una. 18×25/60=7,5 horas, por lo que con esa limpiadora te bastaría para limpiar todas las habitaciones de tu hotel.
Como eres una super business person, te va genial y amplías la capacidad de tu hotel. Ahora son 75 habitaciones. ¿Cómo solucionas las necesidades de personal para limpiar las 75 habitaciones? Posiblemente, dividas el hotel en 4 secciones de 25 habitaciones y contrates a otras 3 limpiadoras para cubrir de manera eficiente tus nuevas necesidades. Esto encajaría con el concepto comentado hace algunas líneas de “Dividir y Paralelizar”, en definitiva, dividir para vencer.
Por otro lado, si tienes en cuenta la estacionalidad y las diferentes temporadas, quizás solo necesites tener en plantilla a dos personas de manera fija y reforzar el equipo de limpieza de manera puntual según las necesidades del hotel. Esto va relacionado directamente con otra de las características estrella de los entornos Big Data. Ser capaz de adecuar de forma dinámica y escalable la infraestructura necesaria en cada momento, flexibilizando costes y escalando en caso de ser necesario.
1.Optimiza el almacenamiento de tus datos, lo que te permite guardar gran volumen de información de forma muy eficiente.
2.Gestiona automáticamente todo el proceso de dividir el total de datos en partes pequeñas y distribuirlas entre diferentes procesadores.
3.Tiene un sistema automático de réplicas y las guarda en diferentes máquinas para que no haya pérdidas de información.
Esto genera de inmediato una serie de beneficios a tu empresa como:
– Data lakes, dejar almacenados datos de forma eficiente y segura, aunque no los vayas a usar inmediatamente, pero sí más adelante en algún momento.
-Escalabilidad. Gozarás de la posibilidad de adecuar el procesamiento y el coste a tus necesidades, levantando o apagando máquinas. ¿Qué supone esto? Que la misma tecnología está al alcance de pequeñas y grandes empresas y que se podrá ir escalando en todo momento, por lo que la capacidad de análisis se vuelve infinita.
El Big Data te proporciona un grandísimo valor con una toma de decisiones mucho más ágil lo que repercute en la reducción de costes y generación de más ingresos.
Referencias:
-Medios: Mailjet, IT Computing y Big Data Magazine
-Libros: González Díaz, I. «Big Data para CEOS y Directores de Marketing», (2017)