Le contenu de cet article n'engage que les convictions de son auteur. Le Blog Keyrus est une fenêtre d'expression pour nos collaborateurs.
La data visualisation a connu un réel essor en France ces dernières années. Le marché français s’est énormément développé et aujourd’hui la data visualisation est incontournable au sein des entreprises, quelle que soit leur taille.
Avant d’analyser ce marché pour trouver l’outil de dataviz qui va répondre à vos besoins, des questions doivent être posées pour bien réaliser votre choix. 1. Quels sont les cas d’usage cibles ? 2. Quelles sont les contraintes techniques ? 3. Quel est le coût ? 4. Quel est le délai de mise en place ?
Les usages cibles vont regrouper entre autres les fonctionnalités souhaitées, mais également le public ciblé. La mobilité est-elle proposée ? Est-il possible de configurer des alertes ? Qui seront les utilisateurs de la solution, leurs rôles (lecteur, développeur) et leur profil (client, métier, analyste) ?
Lister ses contraintes techniques est une étape essentielle pour ne pas se retrouver avec un outil non adapté à son environnement.
Avez-vous besoin de machines pour héberger la solution ? Est-ce que le cloud provider doit être spécifique ? L’outil possède-t-il tous les connecteurs nécessaires pour récupérer les données de vos sources ? Est-ce qu’il remplit vos normes de sécurité ?
Les tarifs peuvent varier selon le modèle que vous souhaitez mettre en place, le type d’architecture que vous avez ou que vous visez, mais également selon le nombre et le type d’utilisateurs qui auront accès à l’outil. Il ne faut pas non plus oublier les coûts supplémentaires qui peuvent s’ajouter tels que l’augmentation du nombre d’utilisateurs et potentiellement de licences, une montée en gamme de la solution, l’ajout de fonctionnalités et widgets optionnels, ou encore le coût des formations.
Le délai de mise en place de la solution peut comprendre l’installation lorsque vous avez un outil on-premise ou un client lourd, ou l’activation et le paramétrage lorsque vous avez une solution cloud SaaS. Il peut également compter le temps des premiers développements.
Power BI, Tableau et Qlik forment aujourd’hui le fameux trio leader de la dataviz. Leurs solutions sont complètes, stables, et s’intègrent assez facilement dans les différents environnements. Bien positionnés sur le marché, ces solutions continuent d’évoluer et d’étendre leurs capacités. On a pu apercevoir par exemple des fonctionnalités orientées Data Science et l’intégration d’analyses augmentées et de langage naturel (NLP : Natural Language Processing) dans leurs interfaces, mais aussi des fonctions de type alerting. A l’heure du cloud, les leaders sont bien présents. Cependant, ils n’omettent pas de compléter leurs offres cloud avec de l’on-premise, qui permet de couvrir un périmètre plus large et plus complet.
Ce qui peut démarquer également les solutions leaders des autres, est le coût. En effet, entre les coûts de licences, de mise en place et potentiellement de formations, le prix peut parfois être élevé. Malgré cela, les éditeurs proposent différents choix de gammes et de types de licences pour s’adapter aux différentes tailles de structures qui vont accueillir la solution ou pour s’adapter aux différents cas d’utilisation. Selon la taille des projets à réaliser, la mise en place peut s’avérer plus ou moins conséquente en termes de temps. Mais les experts sur ces outils sont nombreux et permettent ainsi beaucoup d’efficience depuis l’installation jusqu’au développement des rapports et tableaux de bord.
Power BI est la solution d’analyse, d’exploration et de visualisation de données de Microsoft et tête de proue du marché. Ce qui démarque Power BI de ses principaux concurrents c’est l’attractivité du prix de sa solution, mais aussi son interopérabilité au sein de l’environnement Microsoft et Microsoft Azure. La connexion aux nombreux outils de l’éditeur est simplifiée par rapport à d’autres outils dataviz du marché, et l’intégration de Power BI dans des outils tels que SharePoint ou Teams permettent d’avoir une utilisation unifiée et invite à la collaboration entre les utilisateurs.
Qlik est également une solution leader sur le marché de l’analyse et de la visualisation de données, précédemment grâce à QlikView et plus récemment grâce à Qlik Sense. Qlik Sense étant la solution dataviz de 2e génération de Qlik. Ce qui fait la spécificité de Qlik c’est notamment sa technologie associative unique, qui permet aux utilisateurs une exploration non linéaire, libre et rapide de la donnée. Et également son important et grandissant portfolio de solutions qui couvre tous les aspects de la data et ainsi de nombreux usages.
Tableau Software est un outil de dataviz créé en 2003 et qui est aujourd’hui leader sur le marché de l'Analytics. En 2019 Tableau Software est racheté par Salesforce qui renforce sa visibilité sur le marché de l’analyse et la visualisation de données. Tableau possède des connecteurs natifs vers Knime, Dataiku ou encore Alteryx, et intègre également nativement de l’analyse augmentée. C’est un outil reconnu également pour une personnalisation des visuels très avancée.
Nous avons également sur le marché d'autres solutions qui se rapprochent des modèles des leaders. Ces solutions sont généralement moins matures, moins complètes, ou ont moins de visibilité. Elles arrivent tout de même à se positionner correctement sur le marché, car elles proposent des offres intéressantes par rapport à nos 4 critères de sélection. Certaines de ces solutions ont également déjà un historique client, ce qui contribue à leur visibilité.
Looker est une plateforme SaaS de Business Intelligence, acquise par Google en 2019. Elle permet l’exploration, l’analyse et la visualisation des données. Looker possède un langage de modélisation propriétaire, simple d’utilisation et performant, le LookML. Le modèle écrit en LookML permet de composer des requêtes SQL ce qui fait que l’outil s’intègre à n’importe quelle base de données SQL. L’outil est aussi compatible avec les environnements multicloud et hybrides.
Metabase est un outil de business intelligence disponible en offre open source, mais également en version Starter, Pro et Enterprise. Parmi ces offres le déploiement peut se faire on-premise, via Docker ou un fichier .jar, ou sur le cloud as a service. Metabase met en avant la simplicité d’utilisation de l’outil et la rapidité de mise en place de ce dernier. Il se veut accessible non pas qu’aux analystes et aux développeurs mais abordable à tous, grâce à leur interface de construction de requête visuelle. Néanmoins, Metabase met à disposition un éditeur SQL pour les cas les plus complexes.
MicroStrategy est une plateforme de visualisation, de reporting et d’analyse avancée de la donnée. Elle offre des capacités de Direct query, adaptées à une utilisation sur des Data warehouses cloud. MicroStrategy possède également l'application HyperIntelligence, qui permet d'introduire des analyses contextualisées dans des contenus web, mobiles ou sur Microsoft Outlook.
Preset est une plateforme d’analyse de données jeune, fondée en 2019, construite sur la solution open source Apache Superset. Preset propose une interface visuelle intuitive et accessible à tous grâce à un générateur de visuels sans code. Les tableaux de bord sont rapides à créer, et offre de beaux visuels. L’outil permet également des analyses plus poussées avec leur propre éditeur SQL collaboratif.
SAP Analytics Cloud est une plateforme native cloud offrant un grand éventail de capacités d’analyse. La solution s’intègre entièrement dans l’écosystème des applications d’entreprise SAP, ce qui peut être un plus pour ceux qui utilisent déjà des applications métiers SAP. Elle possède des fonctions d’analyses augmentées telles que la génération d’insights, de l’analytique conversationnelle ou encore de l’analytique prédictive.
SAS Visual Analytics est une application de reporting, d’exploration et d’analyse de données, avec une interface visuelle low-code via l’application d’IA et de langage naturel. SAS offre SAS Visual Analytics sur sa plateforme SAS Viya, qui regroupe de l’IA, de l’analytique ainsi que de la gestion de données. Parmi ses fonctionnalités d’IA, on retrouve la personnalisation de chatbots en langage naturel, mais aussi l’analyse textuelle permettant de connaître le ressenti positif ou négatif d’un contenu au format texte.
Sisense est une plateforme d’analytics qui a vu le jour en 2010. Elle met en avant sa Fusion Embed, qui lie l’IA aux analyses intégrées. L’outil possède aussi de nombreux connecteurs de données et permet d'exploiter la donnée mise en cache pour de meilleures performances.
ThoughtSpot propose une interface d’analyse cloud moderne, basée sur la recherche (à la Google) et l’IA pour l’analyse en self-service et la création d’insights détaillés. Grâce au requêtage en langage naturel (NLQ), les utilisateurs peuvent avoir les réponses à leurs questions sans avoir de connaissances techniques.
Tibco Spotfire se qualifie de plateforme analytique la plus intelligente, grâce à son moteur de recommandations alimenté par de la data science incorporée, permettant d’indexer les patterns les plus pertinents de vos données. L’outil propose également une puissante capacité de géo-analyse, ainsi que l’analyse combinée de données historiques et en streaming.
AUTRES CHALLENGERS : Infor Birst, Domo, IBM Cognos Analytics...
D’autres solutions du marché vont être les outils de niche. Ces solutions sont développées pour des besoins métiers spécifiques, concentrées sur une expertise, ou communément utilisées dans des cas distinctifs par les clients. Questions usages, la liste peut être moins exhaustive que pour les autres outils, mais avec des fonctionnalités beaucoup plus spécialisées. La solution de niche va pouvoir être caractérisée par son usage cible principal, ou encore son périmètre d’action selon, l’environnement sp écifique dans lequel il s’intègre, et selon les profils utilisateurs ciblés.
Dash est un framework low-code basé sur Plotly.js et React.js, qui permet de construire des applications data en Python ou R notamment. Une version open source existe, mais Dash propose également une version Entreprise. L’outil est très axé IA et data science, avec des fonctionnalités telles que du NLP, de l’analyse prédictive ou encore de la détection d’objet.
Mode est une solution SaaS sur le cloud, plus technique que la moyenne des solutions du marché. Il combine du SQL, du Python, du R et de l’analyse visuelle. C'est un outil destiné principalement aux data scientists et data analysts.
Shiny est un package R, qui permet aux utilisateurs de pouvoir interagir avec leurs données et les analyser. L’outil combine le langage R avec les fonctionnalités web modernes via du CSS, du HTML et du JavaScript. Savoir programmer en R est nécessaire ici.
Streamlit est une solution permettant de déployer et de partager des scripts de données en applications web. Le langage utilisé ici est le langage Python, à utiliser via l’API de Streamlit. La solution propose une bibliothèque open source permettant de créer les widgets ainsi que les visualisations qui composent les applications, et propose également une offre Cloud pour le déploiement, la gestion, le partage et la collaboration des applications Streamlit.
Créé en 2015, Toucan Toco est un outil de visualisation mais pas d’exploration. En effet, Toucan Toco se concentre particulièrement sur la data storytelling et se destine ainsi aux utilisateurs métiers, utilisateurs finaux, et non pas aux analystes. Toucan Toco met alors en avant la complémentarité que son outil a avec les autres solutions de BI classiques.
Une autre catégorie se présente sur le marché de la dataviz, il s’agit de l’Open Source. L’open source est considéré comme une alternative aux produits classiques du marché. Des modèles différents existent, certains complètement gratuits, d’autres intégrés dans des offres payantes. Certaines de ces dernières ont été citées précédemment et ne seront pas présentées dans leur version gratuite au sein cette section. Le format open source a ses avantages, mais aussi ses inconvénients. Si on commence par ces derniers, on peut notifier par exemple un support ou une assistance technique généralement faible ou moyenne. Aussi, une complexité qui demande des compétences de développement. Une incompatibilité avec certaines suites logicielles ou encore l’incertitude sur la stabilité des communautés. Par contre au niveau des avantages, nous avons le coût d’acquisition relativement moins cher, par rapport aux solutions classiques, voire gratuit. L’open source permet aussi la maîtrise, qui procure une indépendance contrairement aux solutions d’éditeurs, et la transparence du code source. Et on a de plus des solutions qui sont flexibles et modulables.
Chart.js est un outil de visualisation de données open source basé sur du JavaScript. Il propose uniquement huit catégories de graphiques, très beaux visuellement, et ces derniers sont également interactifs et animés, responsive, et customisables. L’outil est plutôt destiné aux développeurs et designers.
D3.js est une bibliothèque JavaScript open source qui permet de manipuler des documents basés sur des données. Plutôt destiné à des profils développeurs, l'outil tire parti des capacités des navigateurs web modernes grâce à l’utilisation du HTML, du CSS et de SVG pour créer des graphiques avec beaucoup de flexibilité.
Petit avertissement concernant les licences associées aux bibliothèques JavaScript : certaines licences doivent être acquises pour autoriser un usage d’entreprise et peuvent engendrer des coûts.
Redash est une solution open source permettant d’explorer, de requêter, de visualiser et de partager la donnée. Elle est accessible par navigateur internet grâce à une URL partageable. La solution supporte aussi le SQL, le NoSQL, le Big Data et les sources de données API. Redash open source est auto-hébergée et nécessite un serveur Linux ou une VM ou un conteneur Docker.
Superset est une solution open source d’exploration et de visualisation de données. Elle propose un environnement de développement intégré SQL no-code pour faciliter l’intégration et l’exploration des données. Un grand nombre de bases de données sont supportées, ainsi qu’une large palette de très belles visualisations tout en gardant la possibilité de créer des visualisations customisées.
AUTRES OUTILS OPEN SOURCE : Grafana...
Vous trouverez sur ce lien une grille de positionnement permettant de comparer les fonctionnalités des acteurs du marché.
Le marché continue de se diversifier, et les outils à se multiplier. Il n’est pas forcément simple de se retrouver entre plateformes d’analyses multifonctionnelles et simples outils de visualisation de données. Mais en répondant aux quatre questions posées en début d’article, une liste d’outils candidats va pouvoir se dessiner. Et avec une priorisation des critères de sélection un choix final peut se formuler. N’oublions pas que des outils aux fonctions différentes peuvent parfois se compléter (pour cocher toutes les cases), tout en rentrant dans les critères de choix définis. Des solutions hétéroclites peuvent ainsi permettre de s’adapter et de construire un modèle hybride. D’autant plus que certaines catégories de solution peuvent faciliter ces associations telles que les solutions de niche ou open source. Une dernière question peut finalement s’ajouter à nos 4 critères de sélection initiaux, pour compléter son choix : Quelle est la durée de vie de la solution choisie ? La durée de vie va avoir deux dimensions. Dans un premier temps sa durée de vie sur le marché. Est-ce qu’il existe une communauté de compétences suffisamment développée pour garantir la longévité de l’outil ? Et dans un second temps, sa durée de vie là où l’outil a été intégré. Et est-ce que l’outil sera pérenne selon l’évolution de votre environnement et de votre activité ?