Vous quittez notre site principal pour accéder à notre site chinois hébergé en Chine. Pour des raisons légales, aucun lien ne vous ramènera vers notre site principal.

Accéder au site chinois
Logo - Keyrus
Logo - Keyrus
  • Playbook
  • Services
  • Insights
  • Partenaires
  • Carrières
  • Qui sommes-nous ?
    Raison d'être
    Innovation & Technologies
    Keyrus s'engage
    Conformité & Règlementation
    Investisseurs
    Équipe de direction
    Marques
    Implantations

Article de blog

Retour sur useR! 2019 : de la grammaire à l'humanitaire

Article publié par Gabrielle Devaux, Consultante Data Science chez Keyrus

Google, Twitter, Airbnb, HSBC, Uber, The New York Times… Ces entreprises ont des secteurs d'activité très différents, mais utilisent toutes le langage R au quotidien. R est un langage de programmation open source, dont l'utilisation est gratuite même dans le contexte de l'entreprise. Il intègre de nombreuses fonctionnalités pour la manipulation de données et la restitution de graphiques. Les domaines d'application sont nombreux : études marketing, business analytics, analyse de sondages, biostatistiques, génétique, économétrie, statistiques spatiales, enseignement, etc. R est un langage en constante évolution, enrichi en permanence par la communauté des développeurs.

Depuis 2006, une conférence internationale appelée "useR!" a lieu chaque année pour regrouper cette communauté. C'est l'occasion d'échanger autour des réalisations des uns et des autres, des nouvelles fonctionnalités du langage, et des évolutions à venir. Cette année, la ville de Toulouse (France) a été choisie pour accueillir ce congrès, qui s'est déroulé du 9 au 12 juillet 2019 et a rassemblé 1200 personnes.

Le langage R est utilisé à Keyrus pour l'analyse de données et la Data Science. Participer à cet événement permet de se mettre à jour sur les utilisations optimales de cette technologie. Près de 300 présentations, tutoriels, posters ont eu lieu lors de cette conférence, et nous vous proposons un résumé de 4 d'entre eux :

  • Le "datathon" organisé par useR! qui a été remporté par l'équipe Keyrus

  • L'utilisation des réseaux de neurones pour prédire le genre grammatical

  • L'Intelligence Artificielle pour réparer le monde

  • Sublimer les analyses textuelles avec des nuages de mots

 

Datathon : le diabète à travers le monde (1re place)

Le diabète est une maladie provoquant une mauvaise régulation du taux de sucre dans le sang. Plus de 90% des cas de diabète sont provoqués par un ensemble de facteurs favorisants : prédisposition génétique, mauvaise alimentation, surpoids. Des données hébergées par World Bank Group regroupent des mesures sur de nombreux indicateurs santé, nutrition et démographie dans 258 pays ou régions, pour les 57 dernières années. Ces données ont été utilisées pour réaliser une étude statistique des facteurs influençant le diabète. L'objectif est d'identifier des corrélations entre les caractéristiques d'un pays (niveau de vie, données médicales et sociales) et sa proportion d'habitants diabétiques.

Cette étude a été menée dans le cadre d'un datathon organisé pour useR! 2019, destiné aux étudiants ou jeunes statisticiens. Un datathon est un concours, challenge, sur un thème concernant l'étude de la donnée. Trois membres de la communauté Data Science & IA de Keyrus ont soumis cette étude et ont eu l'honneur de remporter le premier prix : Philomène Bobichon, Lucille Chrétien, et Gabrielle Devaux.

Lien vers le sujet du datathon : http://www.user2019.fr/datathon/ Lien vers la soumission Keyrus : http://www.user2019.fr/static/uploads/winner_datathon2019.html

Die Nutella oder Das Nutella ?

En allemand, les mots sont répartis en trois genres grammaticaux : neutre, féminin ou masculin. Pour certains mots, l'attribution du genre semble complètement aléatoire. Cependant on peut identifier quelques terminaisons qui ont tendance à ressortir par genre.

L'objectif de cette étude est de construire un modèle de réseaux de neurones permettant de prédire le genre d'un mot allemand. Ce modèle a été entraîné à partir d'un dictionnaire de plus de 300 000 mots et leur genre avec la librairie Keras en R. Plus précisément, c'est un réseau de neurones "Long Short-Term Memory" qui a été utilisé.

Une fois le modèle entraîné, on regarde sa performance en calculant la prédiction du genre pour un grand nombre de mots et on compare cette prédiction (masculin, féminin ou neutre) avec la réalité. La précision de ce modèle est de 97.8% de genres correctement prédits, ce qui est très performant. En allemand, le mot "Nutella" n'a pas de genre. Selon les régions d'Allemagne, les habitants lui en ont assigné un.

Comme on peut le voir sur la carte ci-dessus, la tendance du genre du mot Nutella est féminin (rouge) ou neutre (bleu). Le masculin est peu représenté (jaune). En utilisant le modèle pour prédire le genre de ce mot, c'est le féminin qui ressort avec une probabilité de 51%, ce qui n’est pas suffisamment précis pour se prononcer. Ainsi, même un modèle performant de prédiction peut avoir du mal avec les subtilités de la langue de Goethe.

Lien vers la présentation : http://www.user2019.fr/static/pres/lt242481.pdf

L'Intelligence Artificielle pour réparer le monde

L'expression "AI for good" est de plus en plus présente dans les tendances actuelles. Des start-ups, entreprises et institutions travaillent à positionner l’IA comme une force qui peut être mise au service du bien commun. Mais comment, en tant que "simple" Data Scientist, peut-on participer à des actions solidaires avec l'Intelligence Artificielle ? Comment nos compétences peuvent-elle être utilisées dans - et en dehors - de nos entreprises ?

Julien Cornebise a commencé à répondre à ces questions en travaillant bénévolement avec Amnesty International sur le projet "Decode Darfur". Avec une équipe de quatre Data Scientists volontaires, il a contribué à la création d'un modèle de Deep Learning permettant de détecter des villages détruits au Soudan à partir d'images satellites. L'objectif est de permettre à Amnesty International, ou d'autres ONG, de savoir où ont lieu les conflits et quelle aide apporter. À plus petite échelle, datakind.org propose une plate-forme pour participer ou créer des actions bénévoles pour le bien commun : hackathons, labellisation, mise en relation avec des ONG.

Lien vers la présentation : useR! 2019 - Keynote: Julien Cornebise Lien vers DataKind : https://www.datakind.org/

Générer des nuages de mots avec {ggwordcloud}

Il n’est pas toujours facile de synthétiser visuellement des idées afin de les transmettre aux autres. Le principe du nuage de mots est basé sur une méthode d’analyse de textes qui permet de mettre en évidence les mots-clés les plus fréquents dans un document. C'est un outil facile à comprendre et à partager. Il est plus percutant et plus efficace qu'une table de données remplie de texte.

La création d'un nuage de mots est très facile avec R. Le package {ggwordcloud} permet de générer ces visualisations en quelques lignes à partir d'une liste de mots et de leur fréquence calculés depuis un corpus. Le texte utilisé pour les deux nuages ci-dessous est l'article "Maintenance prédictive dans l’Industrie, la data créatrice de valeur", que l'on peut retrouver sur le blog Keyrus à l'adresse suivante : https://www.keyrus.com/fr/fr/post/?post_pk=6358.

La taille, la couleur, et l'angle des mots peuvent être choisis par l'utilisateur, et arrangés selon la forme de son choix. Avec ces deux nuages de mots, sans même avoir lu l'article, on peut en déduire qu'il parle de maintenance prédictive sur des machines, en utilisant des réseaux de neurones et du Machine Learning.

Lien vers le package : https://github.com/lepennec/ggwordcloud

Et ensuite ?

UseR! n'est pas qu'un condensé de veille technologique sur le langage R. C'est également un lieu de retrouvailles et de rencontres pour une communauté soudée et passionnée. Des événements à l'échelle nationale ont lieu régulièrement partout dans le monde. ERum (European R Users Meeting) s'est déroulé en 2018 à Budapest (Hongrie) et a rassemblé plus de 500 personnes. Une autre édition est prévue à Milan (Italie) début 2020. En France, des meetups ont lieu presque tous les mois à Paris et Nantes. En juillet 2020, la 8e édition des Rencontres R aura lieu à Paris. Keyrus avait déjà été présent sur l'édition 2018 à Rennes, et le sera certainement sur cette édition 2020.

whatsapptwitter
linkedinfacebookworkplace
newsletter.svg

Ne manquez jamais un insight

Tenez-vous au courant des derniers articles, événements, et bien plus encore

Votre adresse e-mail est uniquement utilisée pour vous envoyer la newsletter Keyrus et à des fins de prospection commerciale. Vous pouvez à tout moment utiliser le lien de désabonnement présent dans chaque newsletter envoyée. En savoir plus sur la gestion de vos données et vos droits.

Poursuivre la lecture

Communiqué de presse

Le Groupe Keyrus entre en négociation exclusive afin de réaliser un investissement stratégique dans Sonum International, leader Européen dans le secteur de l’EPM et spécialiste Anaplan®.

20 janvier 2023

Levallois-Perret (France), La Haye (Pays-Bas) – 20 Janvier 2023: Le Groupe Keyrus annonce être entré dans une phase finale de négociation dans le but d’acquérir une participation majoritaire dans Sonum International (*), un groupe européen, leader dans le conseil et la mise en œuvre de solutions EPM (‘Enterprise Performance Management’).

Événement

WEBINAR : Comment valoriser vos données grâce à la plateforme Talend ?

5 janvier 2023

Keyrus et Talend vous invitent à leur prochain webinaire dédié à la valorisation de vos données.

Événement

Matinale : Industries créatives & culturelles et Web 3. Où en sommes-nous ?

22 novembre 2022

Keyrus participe à la matinée organisée par la CCI Paris autour des NFT et du Web 3 appliqués au monde de la création et de la culture.

Article de blog

Métaverse & pilotage des données : l'expertise du Data Scientist

27 octobre 2022

Le futur est déjà là ! Le métaverse en première ligne est un terme qui est quotidiennement présent dans la presse. Le métaverse est la compression entre la réalité que nous connaissons, la réalité virtuelle et également la réalité augmentée. Ainsi, nous assistons à la disparition entre réalité et fiction…

Avis d'expert

MLOps, la clé pour faire entrer le machine learning dans le quotidien opérationnel de votre entreprise

12 octobre 2022

MLOps (contraction de Machine Learning Operations) est une méthodologie conçue pour optimiser et industrialiser le cycle de vie des projets faisant intervenir des algorithmes de machine learning ou de deep learning et maximiser leur ROI.

Infographie

Métavers, NFT et cryptomonnaie : zoom sur les innovations Web3 en plein boom

1 septembre 2022

Le métavers, un potentiel illimité ? Les NFT, un marché énorme mais qui s'essouffle ? La cryptomonnaie, une adoption pas encore au rendez-vous ?

Communiqué de presse

Keyrus devient l’actionnaire majoritaire de CMG Consulting Group, société de conseil spécialisée dans les métiers de la Banque, de la Finance, de l’Assurance, et de l’Immobilier

16 juin 2022

Paris, Levallois-Perret, le 16 juin 2022 - Acteur international de la Data Intelligence, du numérique et de la transformation des entreprises, Keyrus annonce une prise de participation majoritaire dans le capital de CMG Consulting Group, un réseau de cabinets de conseil spécialisés en pilotage de projet métier, conseil métier, et conseil en organisation dans les secteurs de la Banque, de la Finance, de l’Assurance et de l’Immobilier.

Avis d'expert

Raison d’être et culture d’entreprise pour relever les défis du siècle

16 juin 2022

Entre mutations sociétales majeures et enjeux écologiques pressants, les entreprises doivent repenser leur performance de manière globale.

Témoignage client

La Direction Formation d’Alliance Automotive Group accélère sa transformation

17 mai 2022

Le groupe Alliance Automotive a connu une forte croissance. Harmoniser les activités devenait crucial pour optimiser le fonctionnement du service formation.

Article de blog

Analyse de marché 2022 des solutions dataviz

4 mai 2022

Le marché français s’est énormément développé et aujourd’hui la data visualisation est incontournable au sein des entreprises.

Logo - Keyrus
Siège social

155 rue Anatole France 92593 Levallois-Perret

Téléphone :+33 (0)1 41 34 10 00

Fax :+33 (0)1 41 34 10 10

LinkedInInstagram
PlaybookServicesInsightsPartenairesCarrièresQui sommes-nous ?
Raison d'êtreInnovation & TechnologiesKeyrus s'engageConformité & RèglementationInvestisseursÉquipe de directionMarquesImplantations
Mentions légales & Conditions d'utilisation
Politique de confidentialité
Protection des données