Cuenta la leyenda que hace no mucho tiempo existió una empresa muy buena a la que todas envidiaban porque tenía a los mejores analistas del mercado, las mejores plataformas internas y un porrón de datos propios con los que tomaba todas sus decisiones. Vivían en un mundo idílico, hasta que de repente sus competidores empezaron a adelantarles de manera sorprendente.
¿Pero por qué? Si tenían lo mejor de lo mejor, ¿qué cambió? Cambió el mundo, y ellos que estaban tan ensimismados mirándose el ombligo y lo bien que trabajaban con sus datos internos, ni se dieron cuenta. La pieza final de su maravilloso puzzle eran: los Datos Externos.
En el acelerado entorno actual de los negocios, el poder de las organizaciones depende de la fortaleza de sus datos. En la última década, las empresas han invertido tiempo, dinero y recursos en captar, almacenar y analizar sus propios datos.
Aunque los datos internos pueden mostrar información sobre cómo una organización puede mejorar sus operaciones y sus relaciones con los clientes, pocas empresas consiguen la amplitud y el alcance de datos necesarios para entender los cambios del mercado, descubrir la inteligencia competitiva emergente y existente, y controlar los hábitos de los consumidores.
Lo que les falta son datos externos. Los datos de terceros ayudan a disponer de una mejor comprensión más allá de los datos que generan por sí mismos. Este análisis de conjuntos de datos ampliados permite a las empresas comprender mejor las tendencias generales del sector, identificar los cambios del mercado antes de que los competidores puedan reaccionar, analizar el comportamiento de los clientes para ofrecer nuevos productos o servicios y prever las ventas con mayor precisión.
En una época en la que todas las decisiones estratégicas y financieras dependen del análisis de datos, la pregunta que hay que hacerse es: ¿Por qué no utilizamos más datos?
Forrester señala que el 56% de los responsables de la toma de decisiones en materia de datos y análisis a nivel mundial han ampliado su capacidad para obtener datos externos (o están en proceso de hacerlo), mientras que otro 21% espera hacerlo en los próximos 12 meses.
Ahora más que nunca es importante complementar los datos internos con conjuntos de datos de terceros.
Además, Gartner predice que, para 2022, más de un tercio de las grandes empresas (35%) serán vendedoras o compradoras de datos en mercados online, lo que supone un aumento respecto al 25% de 2020.
Los datos externos, generados por individuos, negocios y sensores tienen su origen en diversas fuentes y se encuentran en una amplia gama de categorías, entre las que se incluyen:
Comportamiento online (búsquedas, redes sociales, uso de aplicaciones, tráfico web, geolocalizaciones)
Consumidores (transacciones, fidelidad)
Individuos (empleo y trabajo, crédito)
Negocios (publicidad, precios, valoraciones y opiniones, ubicación de las tiendas)
Eventos (oficios, satélites y meteorología, detección de eventos)
Datos agregados (IoT, rastreadores web, B2B, datos públicos)
Gracias a las nuevas fuentes de datos relevantes, las organizaciones pueden hacer mejores análisis de datos, modelos más sólidos y además reducir el tiempo de obtención de la información. Los datos de terceros también ayudan a validar hipótesis que serían difíciles de probar sin una validación externa.
Aunque las ventajas de utilizar datos externos son evidentes, las organizaciones extraen aún más valor de los datos de terceros cuando los integran con datos y análisis internos.
Para ilustrarlo, te contamos tres ejemplos que demuestran cómo los datos externos pueden arrojar luz sobre el comportamiento de los consumidores, el análisis financiero y el impacto de los acontecimientos globales, independientemente de la industria:
Las empresas que venden bienes o servicios de consumo suelen utilizar datos internos para conocer las tendencias de sus tiendas. Por ejemplo, los retailers analizan las cifras de ventas de las tiendas para comparar su rendimiento en comparación con las previsiones. Y si lo llevamos un paso más allá, ¿qué pasaría si un retailer combinase los datos meteorológicos históricos con los datos internos para identificar si los cambios meteorológicos afectan a las ventas de sus tiendas? Además de observar las tendencias pasadas, el minorista podría utilizar los datos de previsión meteorológica en tiempo real para predecir qué tiendas pueden verse afectadas por la próxima tormenta u ola de calor. Este análisis puede proporcionar métricas con las que reajustar las expectativas de ventas en las regiones que experimentan fuertes cambios meteorológicos.
Otro ejemplo de información externa útil son los datos de tráfico peatonal. Al conocer el número de visitantes diarios en los distintos establecimientos cercanos a una tienda, el científico de datos del retailer puede empezar a modelar el comportamiento de los consumidores de forma que se puedan predecir las ventas de la tienda. Este análisis puede ayudar a la empresa a asignar mejor el inventario para adaptarse a los patrones de demanda de cada tienda.
Por otro lado, los equipos de marketing han utilizado durante mucho tiempo datos de terceros para detectar las tendencias de los consumidores. Al enriquecer los datos de los clientes procedentes de los sistemas de CRM con datos demográficos, datos de compra y comportamientos online, los marketers pueden hacer comprensiones más claras sobre los intereses de sus clientes y las mejores formas de incentivarlos para que hagan más negocios con la empresa. Los equipos de ventas también pueden beneficiarse de estos datos enriquecidos para orientar mejor sus esfuerzos de venta y acelerar los ciclos de venta.
Las empresas públicas emiten informes trimestrales que informan al público sobre su situación financiera y, a partir de esa información, los inversores deciden si comprar o vender las acciones de esa empresa. Aun así, los inversores inteligentes saben que un balance solo ofrece una imagen instantánea en el tiempo. Por eso, los fondos de cobertura y otras organizaciones de servicios financieros utilizan datos alternativos, o datos recogidos de fuentes no tradicionales como la combinación de flujos de redes sociales, datos de empleo, imágenes por satélite y más. A partir de estos datos las organizaciones financieras pueden predecir si una empresa cotizada cumplirá sus previsiones de beneficios antes de que se anuncien públicamente las cifras financieras tradicionales.
Por ejemplo, el análisis financiero utiliza los datos de tráfico peatonal, que demuestran si los consumidores acuden en masa a las tiendas de una empresa o si hay una tendencia a la baja. Esta información puede superponerse a los datos demográficos para determinar si los consumidores de la tienda coinciden con el público objetivo de esta empresa. Al examinar los datos anónimos de las transacciones con tarjetas de crédito, las devoluciones de productos y las ventas en distintos lugares, los analistas pueden obtener una visión más enriquecida de la empresa y saber si es probable que sus cifras suban o bajen el próximo trimestre.
Para entender el impacto de eventos globales como la pandemia del COVID-19, las organizaciones de todos los sectores están utilizando datos de terceros para tomar decisiones sobre operaciones, empleados y clientes. Por ejemplo, una empresa de construcción utiliza los datos del COVID-19 para decidir sobre el cierre de obras, localizando las incidencias de infección y relacionando esos lugares con sus obras y el número de empleados que trabajan en la zona.
Otra empresa de gestión inmobiliaria está combinando los datos de COVID-19 con sus propios datos de ocupación de edificios para transmitir a los propietarios información sobre cómo la propagación de la enfermedad puede afectar al cobro de los alquileres. Los negocios con ubicaciones físicas están obteniendo datos sanitarios y de recuperación de negocio (como el número de tiendas abiertas en una región o las ventas por tienda en una región) y superponiendo estos datos con las ubicaciones del negocio para tomar decisiones sobre la reapertura de oficinas y tiendas.
Después de haber mencionado todos los beneficios que el uso de los datos externos conlleva, surge una duda: ¿qué impide a las empresas utilizarlos?
Tradicionalmente, el uso de datos externos ha supuesto un reto.
Aunque las razones para obtener datos externos son obvias, llevarlo a la práctica es complicado. Hay dos grandes obstáculos que se interponen en el camino de muchas organizaciones:
Los Data Marketplaces tradicionales son confusos
Las metodologías de intercambio de archivos legacy son propensas a errores y no son seguras
Obtener información de sitios tradicionales puede ser abrumador: ¿Cómo eliges entre la multitud de mercados de datos? ¿Por dónde empiezas? ¿Cómo aseguras qué proveedores son fiables, qué datos serán más útiles y qué valor tiene realmente cada conjunto de datos?
Responder a estas preguntas implica invertir el coste, tiempo y esfuerzo necesarios para encontrar y seleccionar los datos externos más relevantes. Todo se reduce a un problema de escalabilidad. No existe un proceso eficiente para contactar con cada proveedor, evaluar sus datos y adquirirlos.
Las empresas gastan enormes cantidades de dinero contratando equipos que lleven a cabo esta tediosa tarea. Algunas empresas dejan en manos de sus científicos de datos el proceso de adquisición de datos, alejándolos de la tarea para la que fueron contratados: construir modelos de datos. Otras organizaciones utilizan intermediarios y brokers de datos para facilitar las transacciones desde el data marketplace. Esta solución, aunque tiene ventajas, no resuelve los problemas de dependencia de las metodologías tradicionales de intercambio de datos.
Los proveedores siguen usando técnicas tradicionales de descarga de archivos como servidores FTP o APIs para transferir datos. A menudo esto implica copiar archivos e intensos trabajos de ingeniería para extraer, transformar y cargar los datos (ETL). Las APIs pueden ser una carga, tanto para los desarrolladores que tienen que solucionar los problemas de múltiples APIs, como para los equipos de seguridad ya que cada API tiene diferentes métodos de seguridad y autentificación. Además, esta interfaz es ineficaz para recibir grandes volúmenes de datos.
Pero el mayor problema de estos métodos de intercambio de datos es que siempre dan lugar a copias de datos obsoletas que son caras de adquirir. La transferencia manual de los datos es propensa al error y puede ocasionar posibles problemas de seguridad y cumplimiento legal. El resultado son datos dudosos que dan lugar a análisis deficientes.
En conjunto, estos retos dan lugar a una pregunta: ¿Cómo se pueden utilizar los datos externos a escala sin perder tiempo, dinero y recursos y sin comprometer la seguridad y el cumplimiento legal?
La obtención y el acceso a los datos externos no debería llevar más tiempo que el propio análisis de los datos. Es necesario eliminar las numerosas barreras que presentan Data marketplaces tradicionales y las antiguas prácticas de intercambio de datos. Con una nueva propuesta, las organizaciones podrán descubrir y evaluar las fuentes de datos fácilmente y cruzar datos externos con internos para realizar análisis rápidos.
Snowflake Data Cloud es la solución que resuelve estos problemas. La arquitectura muticluster de datos compartidos de Snowflake permite centralizar los datos en una ubicación única y segura que conecta a los clientes, partners, proveedores de datos y servicios de datos de Snowflake con el resto de proveedores y áreas de la nube. Como resultado se eliminan los silos y las barreras tradicionales de acceso a los datos e inmediatamente las organizaciones podrán beneficiarse de disponer de datos seguros y gobernados, que pueden compartirse dentro y fuera de la empresa.
Esto es posible gracias a la capacidad de Snowflake de compartir datos de forma segura, es decir, permite acceder a los datos compartidos en tiempo real desde su ubicación original. Nunca se crean copias de datos ni se realizan transmisiones de datos. Los datos no se mueven.
En cambio, existe una versión única, actualizada y centralizada de los datos. Cualquier persona a la que se le conceda acceso puede consultar los datos de forma controlada y segura, sin obtener la custodia física de los mismos. Como todos los cambios se realizan sobre una única versión de los datos, estos permanecen actualizados para todos los consumidores, sin riesgo de latencia para usuarios concurrentes.
El intercambio seguro de datos significa que los datos compartidos pueden ser combinados de forma instantánea con los datos existentes para realizar análisis más rápidos.
Los datos están disponibles en un formato que permite consultarlos sin necesidad de replicación, transformación o procesamiento, permitiendo que las demoras en su análisis sean agua pasada.
Gracias al carácter agnóstico de la plataforma cloud donde se implante, Snowflake permite a las organizaciones tener un acceso fluido e inmediato a todos los datos compartidos, independientemente de la infraestructura, ubicación geográfica o proveedor de la nube (AWS, Azure o Google Cloud Platform) que se elija. El Data Sharing seguro permite incluso que las organizaciones compartan datos con empresas que no tienen una cuenta en Snowflake, lo que la convierte en una función global e inclusiva.
Los consumidores pueden acceder en tiempo real a los datos de terceros que residen en el Snowflake Data Marketplace. En lugar de perder tiempo buscando proveedores y descargando datos obsoletos, los consumidores pueden utilizar Snowflake para evaluar y acceder fácilmente a datos externos en vivo, de forma segura y conforme a la normativa, sin dificultades y de forma instantánea.
Una vez salvada la tarea de transformación, el proceso de integración de los datos externos con los existentes será rápido y fluido.
Estamos listos para el análisis de datos.
Además, puedes mejorar la calidad de tus propios datos con los métodos de enriquecimiento disponibles, sin pasar por los tradicionales procesos de copia y transformación de datos, que conllevan mucho tiempo y pueden plantear problemas regulatorios y de seguridad. Gracias a Snowflake Data Marketplace puedes compartir conjuntos de datos con proveedores externos que permitan llevar a cabo procesos de enriquecimiento y cumplimentación de la información, y los cambios se compartirán de forma segura directamente en tu cuenta de Snowflake.
Tanto si utilizas datos externos para enriquecer la información y mejorar de este modo el análisis de tu negocio, como si los empleas para ayudar a entrenar modelos de IA/Machine Learning (ML) en procesos del área de Data Science, las ventajas de Snowflake Data Marketplace son evidentes.
Facilidad de descubrimiento: Aprovecha las ventajas de tener un único lugar para acceder a una amplia variedad de conjuntos de datos que pueden consultarse, unirse a datos internos, utilizarse en el modelado o añadirse a herramientas de BI, todo ello con rapidez y facilidad.
Datos en tiempo real y actualizados: Olvida las preocupaciones por los datos obsoletos. Todas las actualizaciones realizadas por el proveedor de datos de terceros se reflejarán inmediatamente en tus conjuntos de datos, sin necesidad de intervención manual o programación
Reducción de costes: Elimina los gastos innecesarios de análisis relativos a las tareas de carga, transformación e integración de los datos y gestión de APIs. Al no haber movimiento de datos (solo acceso a los mismos), tampoco se pagan costes de almacenamiento de datos de terceros.
Personalización: Solicita fuentes de datos personalizadas y seguras que se adapten a tus necesidades específicas de información.
Enriquece los datos internos: Utiliza los servicios de enriquecimiento para mejorar la calidad de tus propios datos, compartiéndolos de forma segura con los proveedores.
Acceso total: Dispones de acceso rápido a los datos de terceros de cualquier proveedor relevante de la nube.
Con Snowflake Data Marketplace, la capacidad de acceder de forma segura y combinar rápidamente datos de fuentes de terceros garantiza la entrega de análisis más ricos, mejores conocimientos y una toma de decisiones más informada.
Solo queda una pregunta: ¿Estás preparado para movilizar tus datos?
Referencias: Todos los derechos reservados a Snowflake