Vous quittez notre site principal pour accéder à notre site chinois hébergé en Chine. Pour des raisons légales, aucun lien ne vous ramènera vers notre site principal.

Accéder au site chinois
Logo - Keyrus
Logo - Keyrus
  • Playbook
  • Services
  • Insights
  • Partenaires
  • Carrières
  • Qui sommes-nous ?
    Raison d'être
    Innovation & Technologies
    Keyrus s'engage
    Conformité & Règlementation
    Investisseurs
    Équipe de direction
    Marques
    Implantations

Article de blog

Data sharing : partagez vos données avec Snowflake sans effort !

Article publié par Pierre Coste, Leader Technique – Manager chez Keyrus

De nombreux enjeux actuels tournent autour des données. Cette maîtrise des données offre aux entreprises des leviers pour améliorer leurs performances opérationnelles et financières. En s’appuyant sur Snowflake, une base de données analytique en mode Saas, les entreprises peuvent bénéficier d’un entrepôt de données dans le Cloud évolutif, scalable et performant, leur garantissant un environnement permettant de traiter sereinement toutes leurs données, qu’elles soient structurées ou semi-structurées. Snowflake peut gérer de très grosses volumétries de données, ainsi que des données en temps réel.

Une fois toutes ces données intégrées dans Snowflake, un des aspects de la gouvernance de données peut soulever une question : comment partager facilement les données qui sont stockées dans Snowflake ?

Data sharing traditionnel

Traditionnellement, peu d’entreprises acceptent de donner des accès à des tiers, même en lecture, et ceci qu’ils soient internes ou externes à l’entreprise. Ces accès sont souvent refusés pour une problématique de sécurité et d’ouverture de pare-feu, mais aussi pour s’assurer de ne pas exposer des données confidentielles. Les utilisateurs finaux n'ayant pas accès directement aux données, les solutions possibles sont :

  • réaliser régulièrement des traitements d'exports de données, déposant des fichiers sur des répertoires, des FTP ou autre ;

  • mettre en place des API pour exposer les données. La solution des API est tout à fait convenable mais demande des développements ou des acquisitions de produits ainsi qu'une maintenance logicielle, car une fois que les données sont accessibles, la tendance est d'en fournir plus.

Les limites des API dans un contexte de data sharing peuvent être :

  • la gestion des forts volumes de données : temps important lorsqu'on dépasse le million de lignes par exemple ;

  • la nécessité, pour les utilisateurs finaux, de récupérer la donnée et de la stocker dans leurs propres bases de données pour la traiter et la consommer.

En passant par un tiers (fichier ou API), les données ne seront jamais accessibles en direct et des actions seront donc nécessaires pour récupérer les dernières données.

Data sharing sous Snowflake

L'architecture Snowflake qui repose sur deux piliers, "Multi-cluster et shared data", permet de revoir ce mode de partage de données. En effet, il est maintenant possible de partager de la donnée facilement, de façon sécurisée et sans impact sur la performance de la base de données. Pas de copie de données, la donnée est disponible au niveau « ligne » en fonction de la sécurité associée et sans avoir à reconstruire/consolider avec des traitements ETL.

Snowflake permet d’accéder directement à la donnée source et de la consommer depuis Snowflake, mais aussi depuis des outils tiers en se connectant avec les connecteurs natifs ou par les drivers ODBC/JDBC.

Comment fonctionne le data sharing sous Snowflake ?

On distinguera la notion de compte Fournisseur, celui qui crée et partage la donnée, et le compte Consommateur qui sera celui qui va traiter et requêter les données. Il existe deux possibilités d'accéder à de la donnée partagée dans Snowflake :

  • en souscrivant un compte Snowflake. L'utilisateur est alors facturé en fonction de sa consommation.

  • en ayant un "Read Only Account" qui peut être considéré comme un sous-compte du compte Fournisseur, accessible depuis une URL différente. Dans ce scénario, c'est bien le compte Fournisseur qui est facturé.

Une fois ces comptes créés, soit les données sont « publiques », soit il est nécessaire d'appliquer une sécurité au niveau « ligne » pour restreindre l'accès aux seules données que l'utilisateur a le droit de voir. Dans le second cas, une vue est recommandée pour mettre en place cette sécurité au niveau « ligne ». Cette vue permettra d'appliquer un filtre en fonction de l'utilisateur, et c’est celle-ci qui sera partagée et qui permettra au consommateur de lire la donnée.

Pour sécuriser les données, Snowflake a développé des « vues sécurisées ». En effet, le plan d'exécution de ces requêtes est fait de telle sorte qu'il exécute dans un premier temps le code SQL de la requête, et ensuite les différents filtres et opérations réalisés sur cette vue. Il n'est donc pas possible de savoir d'où proviennent les données ou d'essayer de voir le contenu des données auxquelles l'utilisateur n'a pas accès.

Tutorial Data sharing avec Snowflake

Pour illustrer ceci simplement, prenons le cas d’usage d'un suivi financier d'une entreprise comprenant plusieurs franchises (sources dans le projet GitHub). 

L'objectif pour le groupe est de consolider les données et les exploiter, mais aussi de fournir aux franchises la possibilité de voir leurs résultats financiers. Pour ce faire, nous alimenterons une table de finance contenant les données de toutes les franchises, et un identifiant de groupe indiquant qui a le droit de voir ces données. Une deuxième table donnant les accès par l'association groupe / utilisateur sera alimentée pour gérer la sécurité.

Pour faciliter la gestion, les tables seront créées dans un schéma nommé "private". Les objets accessibles comme la vue sécurisée seront, quant à eux, dans un schéma "public". C'est ce schéma qui sera partagé et disponible par les comptes Consommateurs.

Ces comptes, qui ont maintenant accès aux données, peuvent requêter directement depuis la console Snowflake, mais aussi utiliser leurs outils de data visualisation en interne pour explorer les données disponibles. Snowflake fonctionnant sur un modèle de "Warehouse", les utilisateurs consommant les données n'impacteront pas les utilisateurs de la plate-forme Snowflake.

Ainsi, nous avons pu voir dans cet article qu’il était simple de partager des bases de données dans Snowflake. Cela en s'appuyant sur des fonctionnalités natives du produit et en se focalisant sur les données, et non pas sur les outils et les problématiques de performances et mise à disposition des données.

whatsapptwitter
linkedinfacebookworkplace
newsletter.svg

Ne manquez jamais un insight

Tenez-vous au courant des derniers articles, événements, et bien plus encore

Votre adresse e-mail est uniquement utilisée pour vous envoyer la newsletter Keyrus et à des fins de prospection commerciale. Vous pouvez à tout moment utiliser le lien de désabonnement présent dans chaque newsletter envoyée. En savoir plus sur la gestion de vos données et vos droits.

Poursuivre la lecture

Communiqué de presse

Le Groupe Keyrus entre en négociation exclusive afin de réaliser un investissement stratégique dans Sonum International, leader Européen dans le secteur de l’EPM et spécialiste Anaplan®.

20 janvier 2023

Levallois-Perret (France), La Haye (Pays-Bas) – 20 Janvier 2023: Le Groupe Keyrus annonce être entré dans une phase finale de négociation dans le but d’acquérir une participation majoritaire dans Sonum International (*), un groupe européen, leader dans le conseil et la mise en œuvre de solutions EPM (‘Enterprise Performance Management’).

Événement

WEBINAR : Comment valoriser vos données grâce à la plateforme Talend ?

5 janvier 2023

Keyrus et Talend vous invitent à leur prochain webinaire dédié à la valorisation de vos données.

Événement

Matinale : Industries créatives & culturelles et Web 3. Où en sommes-nous ?

22 novembre 2022

Keyrus participe à la matinée organisée par la CCI Paris autour des NFT et du Web 3 appliqués au monde de la création et de la culture.

Article de blog

Métaverse & pilotage des données : l'expertise du Data Scientist

27 octobre 2022

Le futur est déjà là ! Le métaverse en première ligne est un terme qui est quotidiennement présent dans la presse. Le métaverse est la compression entre la réalité que nous connaissons, la réalité virtuelle et également la réalité augmentée. Ainsi, nous assistons à la disparition entre réalité et fiction…

Avis d'expert

MLOps, la clé pour faire entrer le machine learning dans le quotidien opérationnel de votre entreprise

12 octobre 2022

MLOps (contraction de Machine Learning Operations) est une méthodologie conçue pour optimiser et industrialiser le cycle de vie des projets faisant intervenir des algorithmes de machine learning ou de deep learning et maximiser leur ROI.

Infographie

Métavers, NFT et cryptomonnaie : zoom sur les innovations Web3 en plein boom

1 septembre 2022

Le métavers, un potentiel illimité ? Les NFT, un marché énorme mais qui s'essouffle ? La cryptomonnaie, une adoption pas encore au rendez-vous ?

Communiqué de presse

Keyrus devient l’actionnaire majoritaire de CMG Consulting Group, société de conseil spécialisée dans les métiers de la Banque, de la Finance, de l’Assurance, et de l’Immobilier

16 juin 2022

Paris, Levallois-Perret, le 16 juin 2022 - Acteur international de la Data Intelligence, du numérique et de la transformation des entreprises, Keyrus annonce une prise de participation majoritaire dans le capital de CMG Consulting Group, un réseau de cabinets de conseil spécialisés en pilotage de projet métier, conseil métier, et conseil en organisation dans les secteurs de la Banque, de la Finance, de l’Assurance et de l’Immobilier.

Avis d'expert

Raison d’être et culture d’entreprise pour relever les défis du siècle

16 juin 2022

Entre mutations sociétales majeures et enjeux écologiques pressants, les entreprises doivent repenser leur performance de manière globale.

Témoignage client

La Direction Formation d’Alliance Automotive Group accélère sa transformation

17 mai 2022

Le groupe Alliance Automotive a connu une forte croissance. Harmoniser les activités devenait crucial pour optimiser le fonctionnement du service formation.

Article de blog

Analyse de marché 2022 des solutions dataviz

4 mai 2022

Le marché français s’est énormément développé et aujourd’hui la data visualisation est incontournable au sein des entreprises.

Logo - Keyrus
Siège social

155 rue Anatole France 92593 Levallois-Perret

Téléphone :+33 (0)1 41 34 10 00

Fax :+33 (0)1 41 34 10 10

LinkedInInstagram
PlaybookServicesInsightsPartenairesCarrièresQui sommes-nous ?
Raison d'êtreInnovation & TechnologiesKeyrus s'engageConformité & RèglementationInvestisseursÉquipe de directionMarquesImplantations
Mentions légales & Conditions d'utilisation
Politique de confidentialité
Protection des données