Outil intelligent de data quality

Partager sur linkedin
Partager sur twitter
Partager sur facebook

Outil intelligent de data quality

Pour les acteurs de l’industrie agroalimentaire, gérer finement un référentiel produit peut être un défi de taille. Aujourd’hui, grâce au machine learning, il est possible d’optimiser la qualité des informations produit.

C’est tout l’enjeu de notre client qui a fait appel à nos équipes de data scientists pour mettre en place un système automatisé de détection et d’analyse des erreurs de son référentiel.

Contexte

Lorsqu’une entreprise possède un catalogue de produits de plus de 6000 références caractérisées par plus de 250 variables, mis à jour régulièrement et donc en évolution permanente, la quantité de données liées aux produits ne cesse d’augmenter elle aussi…

Tout comme la quantité d’erreurs ! Une situation critique qui peut mettre à mal toute la chaîne de production et d’approvisionnement des réseaux de distribution.

 

Objectifs

Taux d’erreur trop élevé dans le référentiel, systèmes de règles de validation Métiers non exhaustives et non évolutives…

Notre client souhaite fiabiliser son catalogue et ainsi réduire les coûts liés aux erreurs. Notre objectif est donc de proposer une solution qui détecte les erreurs du PIM (Product Information Management) et propose des correctifs pertinents sans qu’aucune règle ne soit explicitement écrite.

 

Approche méthodologique

Comprendre l’existant

Accompagnement sur les choix techniques (bases de données, outils d’analyses…)
Définition d’une architecture évolutive et performante

Apport d’expertise

  • Sur l’algorithmie et les solutions de Machine Learning,
  • Sur la programmation Python pour développer les modèles et adapter les résultats pour être facilement intégrable dans l’outil
  • Sur la conception de visualisation interactive et flexible de la conception (Power BI)

 

Livrable(s)

  • Développement d’algorithmes de détection automatisé des erreurs du référentiel à partir d’algorithmes basés sur de la statistique et sur du machine learning
  • Construction d’un outil d’analyse interactif (Power BI) permettant de comprendre les erreurs détectées par les algorithmes : interface interactive utilisable par les métiers (dashboard de synthèse, dashboard de priorisation de la correction, dashboard de détails d’erreur par produit, analyse de corrélation).
  • Traitement des faux positifs
  • Appropriation de l’outil par les métiers

Data & Marketing client

Accompagner les organisations et les entreprises dans la déclinaison opérationnelle et l’exploitation de leur stratégie de transformation marketing, digitale et data.

Améliorer l’expérience utilisateur, la connaissance client, l’animation marketing omnicanale.

Présentation de l’équipe

Guillaume_logoless
Guillaume
Pinaud
Directeur Data & Customer Marketing
olivier
Olivier
Berbille
Directeur d'agence novencia Lyon
cao
Cao Tri
DO
Data Analyst & Data Scientist

Envie de travailler dans ce domaine ?

Data & Marketing client
Data Scientist (F/H)
Data & Marketing client
Coordinateur de Projet Data (F/H)
Data & Marketing client
Manager Conseil Marketing Omnicanal (F/H)
Data & Marketing client
Chef de projet BI - Lyon (F/H)
Data & Marketing client
Manager Data Scientist Marketing (F/H)
Data & Marketing client
Data Analyst Marketing (F/H)
Data & Marketing client
Data Scientist Marketing (F/H)
Data & Marketing client
Manager Projet Data (F/H)