Vous quittez notre site principal pour accéder à notre site chinois hébergé en Chine. Pour des raisons légales, aucun lien ne vous ramènera vers notre site principal.

Accéder au site chinois
Logo - Keyrus
Logo - Keyrus
  • Playbook
  • Services
  • Insights
  • Partenaires
  • Carrières
  • Qui sommes-nous ?
    Raison d'être
    Innovation & Technologies
    Keyrus s'engage
    Conformité & Règlementation
    Investisseurs
    Équipe de direction
    Marques
    Implantations

Avis d'expert

Machine Learning : Attention aux solutions clé en main

Bouzid AIT AMIR, Team Lead Data Science

Khalil EL MAHRSI, Tech Lead Machine Learning & Intelligence Artificielle

Automatiser la sélection & le paramétrage d'un modèle de Machine Learning grâce à l'AutoML1 : l'idée est séduisante. Mais dans la pratique, la préparation des données reste une étape clé et la plus chronophage du processus de Data Science qui reste hors du périmètre de l'AutoML.

Le Machine Learning est, aujourd'hui, de plus en plus considéré comme la clé du succès pour un projet de Data Science.

De quoi s'agit-il ? Concrètement, le Machine Learning est une branche de l'Intelligence Artificielle dans laquelle les algorithmes fournissent au système informatique une nouvelle capacité : accomplir, par apprentissage, des tâches pour lesquelles il n'a pas été explicitement programmé. Exemple ? Vinci Energies a développé en 2017 un outil destiné à assurer une maintenance prédictive des structures métalliques (pylônes électriques, éoliennes…). En lui présentant une série de photos de structures portant des traces de corrosion plus ou moins sévères, l'équipe projet a permis au système d'apprendre à reconnaître une corrosion légère, moyenne ou importante et à recommander une intervention. Autre exemple : l'éditeur de logiciels Adobe développerait en ce moment, avec l’université du Maryland, un algorithme censé détecter les images retouchées. Ce sont également des algorithmes de Machine Learning qui sont implantés dans les véhicules autonomes pour apprendre à reconnaître les obstacles et à réagir en conséquence.

Le développement actuel de ces méthodes s'appuie sur la progression continue des capacités de calcul mais également sur la croissance exponentielle de son carburant privilégié : la data. On estime que 90 % des données informatiques, aujourd'hui disponibles dans le monde, ont été créées au cours des quelques dernières années. D'où un faisceau de facteurs favorables au développement rapide de projets de Data Science s'appuyant sur du Machine Learning.

Un principe proche du Cloud

Pour répondre à la demande croissante d'entreprises de différentes tailles, ne disposant pas toutes de compétences en Data Science ou des moyens matériels en interne (serveurs de calculs, GPUs…), de grands noms comme Amazon, Google, IBM ou Microsoft proposent des plates-formes de Machine Learning accessibles en ligne, selon un principe calqué sur celui du Cloud Computing et du SaaS. On parle de MLaaS (Machine Learning as a Service) et le concept a trouvé rapidement son public. Selon une étude publiée en septembre 2017 par Infoholic Research, le marché du MLaaS devrait connaître une croissance annuelle mondiale de 49 % jusqu’à 2023.

Aujourd'hui, le MLaaS trouve un prolongement dans l'AutoML. Là où le MLaaS propose plusieurs services tels que des modèles de Machine Learning sur étagère ou des plates-formes de développement et de déploiement de modèles, l'AutoML automatise le processus de sélection et de validation d'un modèle de Machine Learning, jusqu'à en faire un Workflow (ou flux de travaux) clé en main, voulu accessible et exploitable par des non spécialistes. Parmi les acteurs les plus emblématiques de l'AutoML, Google figure en première place avec son service Cloud AutoML. Dans la même veine, une série de start-ups proposent d'automatiser tout ou partie d'un projet de Data Science grâce à l'AutoML.

Préparation de données & choix d'un modèle

Pour autant, une réalité s'impose : un projet de Data Science va bien au-delà de la seule évaluation d'un modèle de Machine Learning adapté à la tâche à accomplir. Et la place de l'AutoML dans un projet doit être évaluée avec réalisme. Pour y voir clair, il est important de bien comprendre les différentes étapes d'un projet de Data Science.

La première porte sur l'expression du besoin, c’est-à-dire cerner la problématique à traiter et déterminer comment on se propose d'y répondre. Une fois ce besoin clairement défini, la seconde étape consiste à identifier le périmètre de données sur lesquelles le projet va s'appuyer. Il faut également qualifier les informations et s'assurer qu'elles sont réellement exploitables & pérennes (des données obtenues ponctuellement ne peuvent alimenter un outil destiné à être utilisé sur la distance).

Troisième étape : le traitement et l'enrichissement des données. On parle de Feature Engineering, étape souvent réalisée itérativement entre le data scientist et les métiers. Il s'agit de transformer la donnée pour la rendre exploitable. Il est rare qu'un projet de Data Science opère à l'aide de données brutes. C'est seulement après que l'on passe à l'étape charnière de la sélection d'un modèle de Machine Learning. Le but ? Trouver le juste équilibre entre la performance pure du modèle et la facilité avec laquelle il pourra être industrialisé.

Ce dernier point est essentiel. Le produit fini est en effet un outil clé en main, livré sous forme d'API ou directement intégré à son système d'information et pleinement exploitable par ses collaborateurs. C'est ainsi que travaille l'équipe de 30 data scientists dont dispose Keyrus en Île-de-France.

La partie cachée de l'iceberg

On l'aura compris, l'AutoML ne peut intervenir que sur la partie aval du projet pour automatiser le test des modèles, l'évaluation de leur performance au regard de la tâche envisagée et la qualification de leur output. Or, ce n'est ni la partie la plus importante du projet, ni l'opération la plus délicate.

L'AutoML laisse hors de son périmètre les étapes de Data Preparation, Data Management, Data Qualification et Feature Engineering, parties les plus déterminantes d'un projet et qui représentent à elles seules 60 à 70 % de l'effort total. C'est pourquoi un projet de Data Science ne peut se limiter aujourd'hui à la collecte de données brutes à soumettre à une API d'AutoML. La préparation de données nécessite une intervention humaine s'appuyant sur de véritables compétences.

Réussir un projet de Data Science exige donc l'intervention d'un conseiller possédant une vision à 360 degrés du projet et capable d'actionner les bons leviers (AutoML compris) au bon moment.

Dans l'état actuel des technologies, se fier à 100 % à un moteur AutoML est certainement la meilleure façon de passer à côté de son projet.


1 L’autoML consiste à automatiser les différentes étapes de construction d’un modèle de Machine Learning (comparaison de différents algorithmes, optimisation des hyperparamètres, sélection du meilleur modèle, etc.).

À PROPOS DES AUTEURS

Khalil EL MAHRSI Khalil est Docteur en Informatique et spécialiste en Machine Learning & Deep Learning. Avec plus de 7 ans d’expérience, il a contribué à la réalisation de bout en bout de plusieurs projets de Data Science au déploiement des solutions adéquates pour le stockage des données, en passant par la mise en place d’algorithmes d’apprentissage automatique, jusqu’au développement de visualisations de données. Tech Lead Data Science chez Keyrus depuis un an, il accompagne ses clients sur leurs projets en IA et apprentissage automatique.

Bouzid AIT AMIR Après une formation en économie mathématiques à la Toulouse School of Economics puis en informatique appliquée à Télécom Bretagne, Bouzid a intégré le département d’allocation stratégique d’une banque de gestion d’actifs puis une ESN spécialisée en optimisation et maintenance prédictive dans l’aéronautique et le ferroviaire. Chez Keyrus depuis 4 ans en tant que Team Lead Data Science, Bouzid y a créé et développé une practice Data Science. Aujourd’hui, il conseille et accompagne ses clients sur la réalisation de projets de Data Science, d’Intelligence Artificielle ainsi que des choix technologiques qui en découlent.

whatsapptwitter
linkedinfacebookworkplace
newsletter.svg

Ne manquez jamais un insight

Tenez-vous au courant des derniers articles, événements, et bien plus encore

Votre adresse e-mail est uniquement utilisée pour vous envoyer la newsletter Keyrus et à des fins de prospection commerciale. Vous pouvez à tout moment utiliser le lien de désabonnement présent dans chaque newsletter envoyée. En savoir plus sur la gestion de vos données et vos droits.

Poursuivre la lecture

Communiqué de presse

Le Groupe Keyrus entre en négociation exclusive afin de réaliser un investissement stratégique dans Sonum International, leader Européen dans le secteur de l’EPM et spécialiste Anaplan®.

20 janvier 2023

Levallois-Perret (France), La Haye (Pays-Bas) – 20 Janvier 2023: Le Groupe Keyrus annonce être entré dans une phase finale de négociation dans le but d’acquérir une participation majoritaire dans Sonum International (*), un groupe européen, leader dans le conseil et la mise en œuvre de solutions EPM (‘Enterprise Performance Management’).

Événement

WEBINAR : Comment valoriser vos données grâce à la plateforme Talend ?

5 janvier 2023

Keyrus et Talend vous invitent à leur prochain webinaire dédié à la valorisation de vos données.

Événement

Matinale : Industries créatives & culturelles et Web 3. Où en sommes-nous ?

22 novembre 2022

Keyrus participe à la matinée organisée par la CCI Paris autour des NFT et du Web 3 appliqués au monde de la création et de la culture.

Article de blog

Métaverse & pilotage des données : l'expertise du Data Scientist

27 octobre 2022

Le futur est déjà là ! Le métaverse en première ligne est un terme qui est quotidiennement présent dans la presse. Le métaverse est la compression entre la réalité que nous connaissons, la réalité virtuelle et également la réalité augmentée. Ainsi, nous assistons à la disparition entre réalité et fiction…

Avis d'expert

MLOps, la clé pour faire entrer le machine learning dans le quotidien opérationnel de votre entreprise

12 octobre 2022

MLOps (contraction de Machine Learning Operations) est une méthodologie conçue pour optimiser et industrialiser le cycle de vie des projets faisant intervenir des algorithmes de machine learning ou de deep learning et maximiser leur ROI.

Infographie

Métavers, NFT et cryptomonnaie : zoom sur les innovations Web3 en plein boom

1 septembre 2022

Le métavers, un potentiel illimité ? Les NFT, un marché énorme mais qui s'essouffle ? La cryptomonnaie, une adoption pas encore au rendez-vous ?

Communiqué de presse

Keyrus devient l’actionnaire majoritaire de CMG Consulting Group, société de conseil spécialisée dans les métiers de la Banque, de la Finance, de l’Assurance, et de l’Immobilier

16 juin 2022

Paris, Levallois-Perret, le 16 juin 2022 - Acteur international de la Data Intelligence, du numérique et de la transformation des entreprises, Keyrus annonce une prise de participation majoritaire dans le capital de CMG Consulting Group, un réseau de cabinets de conseil spécialisés en pilotage de projet métier, conseil métier, et conseil en organisation dans les secteurs de la Banque, de la Finance, de l’Assurance et de l’Immobilier.

Avis d'expert

Raison d’être et culture d’entreprise pour relever les défis du siècle

16 juin 2022

Entre mutations sociétales majeures et enjeux écologiques pressants, les entreprises doivent repenser leur performance de manière globale.

Témoignage client

La Direction Formation d’Alliance Automotive Group accélère sa transformation

17 mai 2022

Le groupe Alliance Automotive a connu une forte croissance. Harmoniser les activités devenait crucial pour optimiser le fonctionnement du service formation.

Article de blog

Analyse de marché 2022 des solutions dataviz

4 mai 2022

Le marché français s’est énormément développé et aujourd’hui la data visualisation est incontournable au sein des entreprises.

Logo - Keyrus
Siège social

155 rue Anatole France 92593 Levallois-Perret

Téléphone :+33 (0)1 41 34 10 00

Fax :+33 (0)1 41 34 10 10

LinkedInInstagram
PlaybookServicesInsightsPartenairesCarrièresQui sommes-nous ?
Raison d'êtreInnovation & TechnologiesKeyrus s'engageConformité & RèglementationInvestisseursÉquipe de directionMarquesImplantations
Mentions légales & Conditions d'utilisation
Politique de confidentialité
Protection des données