Cet article n'engage que les convictions de son auteur. Le Blog Keyrus est une fenêtre d'expression pour nos collaborateurs.
Article publié par Simon Leroy, Responsable des Opérations chez Keyrus & Jean-Michel Franco, Senior Director, Product Marketing chez Talend
« Toute organisation, quelle que soit sa taille, a besoin de qualité des données », affirme Gartner dans son nouveau Magic Quadrant 2020 pour les solutions de qualité des données. Et pourtant, avec des données de plus en plus surabondantes et multiformes, il devient difficile de mettre fin au chaos et de reprendre le contrôle avec des données fiables. Les données viennent de partout, souvent incomplètes et/ou inexactes, et polluent en silence les pipelines de données. Non seulement ceci complexifie le travail des professionnels de la donnée mais les empêche de prendre les initiatives nécessaires afin de répondre pleinement aux attentes du business.
Alors même que nous aspirons tous à transformer nos organisations avec le numérique, faisons-nous vraiment confiance à nos données ? Un récent sondage réalisé par Opinion Matters pour Talend indique le contraire : seulement 31 % des professionnels de la donnée ont confiance dans la capacité de leurs organisations à fournir des données fiables en temps voulu.
Les cas d’usage sont légion où l’absence de données fiables se traduit en coût opérationnels, en manque de contrôle des risques, ou en opportunités manquées. Que vous cherchiez à mieux répondre aux besoins de vos clients, à partager une vue à 360 de vos produits ou services, à fluidifier votre supply chain, ou à vous conformer aux dernières contraintes réglementaires, la qualité des données est un facteur clé de succès qui fait la différence entre la réussite et l’échec de vos usages de la data.
Dans cet article, Talend et Keyrus analysent le marché et les tendances du marché de la qualité de données telles que mises en valeur par le Gartner et partagent les cas d’usages récents de clients français.
La qualité des données peut avoir un impact considérable sur les résultats d’une entreprise. Dans l’édition 2020 de son Magic Quadrant, Gartner a mené une enquête client qui montre que « les entreprises estiment le coût moyen d’une mauvaise qualité des données à 11 millions d’euros par an ». D’autres enquêtes Gartner abondent dans le même sens, positionnant la qualité des données comme le principal challenge des initiatives de data management.
Maintenant que la qualité des données n’est plus considérée comme une activité périphérique mais plutôt comme essentielle à la transformation numérique, nous sommes très fiers que Talend soit reconnu par Gartner comme un leader dans la dernière édition du Magic Quadrant pour les solutions de qualité des données, et ce pour la troisième fois consécutive.
Dans l’intitulé de son Magic Quadrant, Gartner a justement remplacé « outils » par « solutions », ceci afin de souligner que les bonnes pratiques en termes de qualité nécessitent plus que de simples outils : il convient notamment d’intégrer des workflows, de l’apprentissage par du machine learning, de la collaboration, de la découverte et analyse de données, de l’automatisation, etc. De plus, la qualité doit pouvoir s’étendre au travers du paysage numérique, ce qui nécessite intégration et extensibilité.
Talend et Keyrus ne peuvent qu’adhérer à cette vision. Par principe, au sein de la plate-forme Talend Data Fabric, la qualité des données est un élément fondateur qui se décline au travers de toutes nos applications : préparation des données en libre-service, intégration de données et applicative, gestion des métadonnées et catalogue de données. De son côté, Keyrus n’a de cesse que de sensibiliser ses clients sur la nécessaire maîtrise de la qualité de données comme facteur de succès de toute initiative centrée sur la data, et de développer les bonnes pratiques pour la gouvernance de données.
Le fait d’être reconnu comme un des leaders de ce quadrant souligne d’une part la capacité à construire une vision pour la qualité des données, et d’autre part la capacité à permettre aux organisations d’accélérer leur transformation numérique avec des données fiables.
L’étude passe également au peigne fin les innovations technologiques du marché les plus impactantes. Passons en revue ces ingrédients clés (en complément de l’intégration et de l’extensibilité citées précédemment) tout en analysant comment elles sont prises en compte dans les solutions Talend :
. Ubiquité : une approche horizontale, plutôt que verticale, sur les données
Talend a toujours considéré la qualité de données comme un principe fondateur de sa plate-forme de gestion de données plutôt que comme une discipline distincte.
Talend Data Fabric considère l’information comme une chaîne de valeur de bout en bout. En son sein, la qualité des données peut être découverte, supervisée, corrigée au fil de l’eau, à chaque étape de la vie d’un pipeline de données. C’est ainsi que nos clients peuvent délivrer des donn ées de confiance, tout au long du cycle de vie de leurs données.
. Simplicité : démocratiser la qualité des données grâce à des applications simples & collaboratives
La qualité c’est l’affaire de tous. Et dès lors, ce que l’on attend d’une solution de qualité des données, c’est qu’elle engage chaque participant potentiel et leur facilite le travail. Il faut plus de simplicité, d’intelligence et d’automatisation pour transformer le chaos croissant des données en ressources précieuses et réutilisables.
Dès son arrivée dans ce Gartner Magic Quadrant en 2011 en qualité de “visionary”, Talend a misé sur la démocratisation de la qualité de données. À l’époque, c’était en adoptant le modèle open source pour cibler une audience plus large de développeurs, puis, en 2016 pour le lancement de Talend Data Preparation, en permettant aux profils non techniques de maîtriser la qualité de leurs données en toute autonomie. L’année suivante, Talend rejoint les leaders de ce Magic Quadrant. Aujourd’hui, avec Talend Data Fabric, nous proposons une plate-forme unifiée et collaborative dans le cloud capable de rassembler tous les acteurs de l’entreprise pour découvrir, partager, et exploiter toutes les données à leur plein potentiel.
. Automatiser : quand la qualité de données rencontre l’intelligence artificielle
Optimiser la qualité des données grâce à l’intelligence artificielle et le machine learning est le nerf de la guerre. « D’ici 2022, 60 % des organisations mettront à profit l’apprentissage supervisé pour améliorer la qualité des données et réduire les tâches manuelles y afférant », prédit Gartner dans son Magic Quadrant.
C’est dans cette perspective que Talend multiplie l’introduction de nouvelles fonctionnalités ayant recours à l’apprentissage automatique. La dernière en date est le Magic Fill qui accélère la préparation des données et la rend accessible à tous pour traiter leurs données plus rapidement et avec plus de précision. Une autre évolution est l’intelligence artificielle explicable, qui permet aux collaborateurs de reprendre le contrôle sur des décisions automatisées par des algorithmes.
. Collaboration : capturer l’expertise humaine pour plus de confiance dans les données
L’automatisation n’est pas une fin en soi. Le succès de la qualité des données provient souvent d’un travail d’équipe, de technologies et de bonnes pratiques qui s’alignent ensemble pour créer un impact. Les collaborateurs doivent conserver le contrôle, et l’expertise humaine doit pouvoir être capturée et orchestrée au travers la chaîne de données. Dans l’offre Talend, Talend Data Stewardship est l’outil qui aide les organisations à organiser tout le processus opérationnel de validation et de remédiation de la donnée dès/tant qu’il nécessite des interventions humaines.
Ces fonctions de data stewardship, déjà mises en exergue par nos clients dans les éditions précédentes de ce Magic Quadrant, continuent de leur offrir une forte valeur ajoutée : Talend Data Stewardship est un élément clé de notre plate-forme Talend Data Fabric, parce qu’elle permet d’institutionnaliser un cercle vertueux avec leurs données en mettant les collaborateurs au centre du dispositif.
La solution Talend Data Fabric offre à nos équipes et nos clients l’ensemble des moyens pour véhiculer au sein du Système d’Information et des partenaires externes des données fiables, validées et tracées. Nos clients ont enfin les moyens d’éviter le traditionnel « Garbage In- Garbage Out » !
Prenons l’exemple de l’Aéroport Marseille Provence : avec un trafic en hausse de 40 % sur la décennie 2008-2018, l’Aéroport Marseille Provence a l’ambition d’accueillir 12 millions de passagers en 2025 et investit sans relâche dans la modernisation et l’extension de ses infrastructures pour atteindre cet objectif. Dans un contexte où les aéroports sont de plus en plus en concurrence, entre eux et avec les autres modes de transport, ces investissements sont cruciaux pour renforcer l’attractivité du pôle aéroportuaire de Marseille et répondre toujours mieux aux attentes des passagers, compagnies aériennes et entreprises qui utilisent ses installations et services. La modernisation de l’aéroport s’accompagne nécessairement d’une transformation des systèmes d’information qui coordonnent les nombreuses activités et services indispensables à son bon fonctionnement. Depuis plus de 5 ans, les consultants et les experts de Keyrus accompagnent la DSI et les directions métiers dans cette transformation.
« Compte tenu des projets lourds que nous étions en train d’engager, nous savions que les échanges inter-applicatifs étaient voués à se multiplier, et que la facilité de mise à disposition de la donnée, en interne et potentiellement en externe, serait un atout pour l’avenir », estime Fréderic Schnell, Chef du Service Études & Projets Informatiques de l’Aéroport Marseille Provence. « C’était donc le moment opportun pour nous équiper d’une solution d’échange de données, en l’occurrence l’ESB de Talend, permettant à la fois de mieux contrôler les flux de données transitant dans le SI, et de réduire les coûts des projets en ayant la possibilité de réutiliser ces flux comme des services. »
Au cœur de cette plate-forme complète d’intégration de données, la gouvernance et la qualité des données jouent un rôle critique. Avec Talend, l’Aéroport de Marseille Provence a su mettre en à disposition de son SI et de ses partenaires extérieurs des données fiables et sécurisées.
Pour en savoir plus sur le retour d’expérience de l’Aéroport Marseille Provence, accédez au cas client.
PONANT est une société de croisière proposant à ses clients une expérience à la croisée des chemins entre luxe et expédition. Le secteur des bateaux de croisière implique beaucoup d’acteurs locaux dans chacun des pays afin d’enchaîner les opérations portuaires, excursions, transferts, etc. De ce fait, recevoir les bonnes informations des bons acteurs au bon moment est indispensable et la société avait atteint ses limites en termes d’interfaces. En effet, les 22 interfaces, de type point à point, développées en mode boîte noire par les différents éditeurs ne permettaient pas d’être autonome sur les évolutions et n’apportaient pas de garanties suffisantes en termes de traçabilité, d’exploitabilité et de montée en charge liée à la croissance de la société. Parallèlement, le changement d’ERP financier a encouragé la mise en place d’un outil permettant d’industrialiser le développement d’interfaces impliquant un gros travail de réécriture.
Keyrus a donc accompagné PONANT dans le choix d’une nouvelle plate-forme d’intégration de données avec la plateforme Talend Data Fabric, capable d’apporter la qualité de données à l’ensemble des besoins techniques de Ponant : les API (Application Programming Interface), l’ETL (Extract Transform Load) et l’ESB (Enterprise Service Bus). L’information est désormais beaucoup plus accessible.
« L’idée est de permettre à tous nos clients B2B, comme les agences de voyage et les tour-opérateurs, de venir chercher l’information pour la mettre à disposition de leur propre système et pouvoir diffuser les calendriers de croisières, le pricing, et les disponibilités en temps quasi réel. Dans ce contexte, Talend Cloud API Services semblait être la solution la plus appropriée », explique Jean-Louis Cambert, CIO chez PONANT. « Nous possédons à présent un environnement cloud multiple comprenant Talend, notre cloud privé et des solutions « pure cloud » comme Salesforce. Et toutes ces solutions communiquent parfaitement entre elles. »
La nouvelle architecture basée sur Talend permet à PONANT de gérer beaucoup plus d’informations, l’objectif étant que l’offre de l’entreprise soit facile à trouver, par rapport aux offres concurrentes avec une information disponibles fiable et à jour, mais aussi que le parcours client soit le plus fluide possible. Une fois la croisière réservée, le futur voyageur peut déjà se projeter dans la croisière grâce au carnet de voyage disponible sur son espace My Ponant, lui-même alimenté par les données provenant d’API exposées par Talend ESB.
Pour en savoir plus sur le retour d’expérience PONANT, accédez au cas client.
Gartner prédit que « d’ici 2022, 70 % des organisations suivront rigoureusement les niveaux de qualité des données, augmentant ainsi la qualité des données de 60% tout en réduisant significativement les risques et les coûts opérationnels ».
L’enjeu, c’est que la data quality soit l’affaire de tous, ce qui avait incité Talend à mettre le data profiling entre toutes les mains dans une solution open source, et désormais à mettre à profit les technologies les plus récentes du Cloud, de la reconnaissance sémantique et de l’intelligence artificielle pour mettre la data quality entre les mains d’une population encore plus large qui cherche à comprendre les données, à les approuver, les commenter, les noter et les améliorer.
C’est tout l’enjeu du Talend Trust Score, que nous avons eu l’occasion de révéler lors d’un récent wébinaire co-animé par Keyrus et Talend. Il s’agit d’attribuer systématiquement à toute source de données un score de confiance pour permettre à quiconque envisage de l’utiliser de répondre instantanément à la question suivante « ce jeu de données est-il digne de confiance ? ». Le trust score est non seulement basé sur des indicateurs de qualité des données, mais aussi sur la popularité et la certification, de sorte que les ensembles de données vraiment fiables et faisant autorité puissent être partagés plus largement à travers l’organisation.
Et ce n’est que le débit de l’histoire. Pensez au Nutriscore et à des applications telles que Yuka pour les produits de grande consommation. Ces outils se sont imposés chez les consommateurs pour guider leurs décisions d’achat. Désormais, ils influencent les producteurs de produits de grande consommation pour améliorer leurs produits. Les données de votre entreprise ne méritent-elles pas un tel dispositif ?
Pendant de nombreuses années, la qualité des données a été le tendon d’Achille des projets data, ralentissant leur succès, leur adoption, et empoisonnant la relation entre l’IT et les métiers quand aux responsabilités de chacun sur les données. Les choses ont changé désormais, alors que les entreprises ont compris que la transformation numérique était l’affaire de tous, tandis que les technologies permettent plus d’automatisation et d’efficacité pour identifier et résoudre les problèmes. Au début des années 90, l’industrie avait fait sa révolution en mettant la qualité au premier plan pour tendre vers le zéro défaut et « faire bon du premier coup ». Sommes-nous prêts pour une telle révolution, cette fois du côté numérique. C’est notre conviction, et c’est ce type de valeur ajoutée que nous voulons apporter à nos clients quels que soit leur taille et leur secteur d’activité. Intéressé pour en parler ?
Téléchargez dès maintenant le Gartner Magic Quadrant 2020
Gartner, Magic Quadrant for Data Quality Solutions, Melody Chien, Ankush Jain, 27 July 2020 Gartner, Survey Analysis: Data Management Struggles to Balance Innovation and Control, Melody Chien, Nick Heudecker, 19 March 2020 Gartner, Build a Data Quality Operating Model to Drive Data Quality Assurance, Melody Chien, Saul Judah, Ankush Jain, 29 January 2020 Gartner, Magic Quadrant for Data Quality Solutions, “Melody Chien, Ankush Jain”, “27 July 2020”
Gartner n’endosse aucun fournisseur, produit ou service décrit dans ses publications de recherche et ne conseille pas aux utilisateurs de technologie de ne sélectionner que les fournisseurs ayant obtenu la meilleure note ou autre désignation. Les publications de recherche de Gartner reflètent l’opinion de l’organisme de recherche de Gartner et ne doivent pas être considérées comme des déclarations de fait. Gartner décline toute garantie, expresse ou implicite, concernant cette recherche, y compris toute garantie de qualité marchande ou d’adéquation à un usage particulier. GARTNER est une marque déposée et une marque de service de Gartner, Inc. et/ou de ses filiales aux États-Unis et dans le monde, et est utilisée ici avec autorisation. Tous droits réservés.
Ce graphique a été publié par Gartner, Inc. dans le cadre d’un document de recherche plus vaste et devrait être évalué dans le contexte de l’ensemble du document. Le document Gartner est disponible sur demande auprès de Talend.