Les news data by novencia 

Cas d’usages, actualités, astuces
mai 2022

 

La data science a longtemps été l’apanage d’experts, que ce soit les data scientists ou les utilisateurs de leurs productions. Mais l’évolution des technologies, la démocratisation de l’accès aux données et la volonté d’explorer de nouveaux cas d’usages opérationnels innovants, permet à tous les utilisateurs de repousser leurs limites.

À  l’aide de l’intelligence artificielle, de nouvelles méthodes de création, d’analyse et d’élaboration de modèles de machine learning sont apparues tout en favorisant l’exploration des données de manière plus interactive.

L'Analytics augmentée, la nouvelle génération de l'Analytics qui monte en puissance !

L’Analytics augmentée

pour automatiser la préparation 

des données

En 2019, Gartner positionnait l’Augmented Analytics numéro 1 de son top 10 des tendances data et analytics. En effet, il prédisait que ce serait un facteur dominant dans les nouveaux achats de plateformes d’analyses et de BI. Aujourd’hui, force est de constater que c’est une tendance lourde et que sa démocratisation est en marche.

L’Augmented Analytics s’appuie sur des techniques de ML et notamment de NLP pour optimiser l’analyse des données.

Ceci afin d’accélérer le travail des équipes techniques et analytics. Et ainsi, permettre de faire des prévisions de manière plus efficace tout en rendant les métiers autonomes. L’automatisation des analyses implique de passer du prédictif basé sur de simples analyses statistiques passées, à une analyse prescriptive basée sur des recommandations.
L’IA est donc destinée à transformer la manière dont les analystes travaillent dans les organisations. Nous passons d’une ère de production de dashboards descriptifs, à des rapports produits avec l’aide de l’intelligence artificielle et donc prescriptifs, voire prédictifs.

On peut donc stimuler l’impact d’une décision future en se basant sur un jeu de données passées. Cela permet de rendre le reporting plus pertinent et directement actionnable en plan d’action. Les équipes métiers peuvent ensuite prendre des décisions applicables en temps réel ou quasi-temps réel.

Ainsi, les tableaux de bord nouvelle génération seront de plus en plus contextualisés et plus collaboratifs.

L’AA est une capacité émergente de la BI. Elle permet d’automatiser la préparation, l’analyse et la visualisation de la donnée mais aussi de pousser encore plus loin le self-service BI. Notamment, en utilisant des données non structurées qui n’étaient pas exploitées auparavant dans le reporting classique (IoT, email etc). Et cela ne fait que commencer !

DES PROJETS INSPIRANTS

Self-Service Power BI

pour démocratiser et accélérer les usages data

La solution Power BI a été choisie comme plateforme BI afin de faciliter les analyses en self-service. Une première Direction Métier, pilote du programme, s’est restructurée afin de devenir un centre d’excellence Power BI. Et ce, dans le but de mettre en place des solutions innovantes suivant les best practices de la plateforme, et de mener la conduite du changement autour de la mise en place d’une culture Self-Service BI.

Dans ce contexte, cette équipe est en charge de concevoir des jeux de données et des rapports mis à disposition des équipes métiers, dans le but d’encourager les analyses au sein de l’entreprise.

Ce projet a pour ambition de démocratiser et faciliter l’accès aux données, fiabiliser les KPIs et la qualité de service des rapports, optimiser l’usage de la plateforme, réduire la saturation des ressources (système sources, Power BI Premium), faciliter l’engagement des équipes métiers dans les sujets BI et étoffer les reportings existants avec de nouveaux indicateurs partagés et complétés.
En effet, après cette phase d’initialisation concluante, d’autres Directions Métiers sont onboardées dans le programme.

Data Quality IA

pour améliorer les résultats de détection d’erreurs

La solution actuelle de Data Quality mise en place chez notre client, une grande banque française, basée sur des systèmes de règles, est insuffisante pour détecter les erreurs et les variations financières anormales sur les contrats de prêts, titres, intérêts, tiers. D’autant plus que ces règles sont dépendantes d’un contexte Métier spécifique ou d’une règlementation sans cesse en évolution.

Nous avons donc déployé notre solution de Data Quality IA afin de mettre en place et suivre des contrôles avancés dans le cadre de la règlementation BCBS 239. En effet, l’enjeu était de reprendre la main sur la Data Quality pour le traitement de forts volumes de données et sur des erreurs complexes (cohérences des données, liées à une incompatibilité de combinaisons de critères ou à un contexte métier spécifique).

La solution a été déployée sur un environnement Big Data On-Premise : Cluster NSX avec plus de 30 Workers nodes, 90T de stockage, 512G ram & 60 cores et pris en compte plus de 30 mois d’historique basés sur 180.000.000 mouvements/jour chacun pouvant avoir 300 caractéristiques.
Notre outil a, notamment, permis de mettre en exergue que 23% des erreurs détectées étaient jusqu’alors inconnues des équipes Métier.

Après une courte période de monter en autonomie des équipes Métier, notre client a pris pleine possession de la solution grâce à une interface d’utilisation et une gestion des erreurs et des faux positifs très facile d’utilisation.

Aujourd’hui, avec les technologies d’IA et de Machine Learning, il est donc devenu possible de facilement et rapidement mettre à disposition une solution avancée, performante et user friendly.

EN INFUSION

Astuces

En découvrir davantage

Une fonctionnalité très récente de Power BI qui améliore grandement l’UX et les possibilités de story telling :

➡️ version blog post : Power BI Blog : New Page and Bookmark Navigators

 

➡️ version officielle doc microsoft : Create page and bookmark navigators – Power BI | Microsoft Docs

 

➡️ Pour choisir le type de plot à faire en fonction des données/problèmes.

➡️ Un petit tutorial pandas.

 

➡️ En panne de datasets ? Voici un super site pour trouver des jeux de données.

 

➡️ Une série de templates Power BI.

L’ACTU DATA