Qualité des données : enjeux et bonnes pratiques du Data Quality Management
Essentielle pour les entreprises, la Qualité des Données se révèle être un enjeu majeur pour les processus opérationnels des métiers tels que le marketing, la finance ou la production. Mais qu’est-ce que la Qualité des Données ou « Data Quality » et comment la garantir sur la durée ?
Qu’est-ce que la Data Quality ?
La Data Quality fait référence à la mise en œuvre d’actions visant à garantir que les données de son système d’information soient correctes et fiables. Les données sont le bien le plus précieux d’une entreprise pour garantir, l’efficacité de ses processus ainsi que la pertinence des décisions et des actions prises. C’est pourquoi il est important d’avoir pleinement confiance en la qualité de sa donnée avant de l’exploiter ou de la diffuser.
Plus la donnée est « consommée », c’est-à-dire utilisée par des processus, plus la donnée doit être de bonne qualité.
Comment mesurer la qualité d'une donnée ?
On mesure cette qualité grâce à des règles « techniques » et des règles « métier ». Les règles techniques représentent des critères intrinsèques à la donnée :
- Complétude de la donnée : la donnée est-elle obligatoire ?
- Validité de la donnée : la donnée a-t-elle bien été renseignée au bon format ?
- Fraicheur de la donnée : quand cette donnée a-t-elle été renseignée ?
Les règles Métier complètent la qualification de cette donnée grâce à un ensemble de règles conditionnelles à sa typologie et à son utilisation. Elles définissent une valeur fonctionnelle à la donnée, au travers de critères de cohérence et d’accessibilité par exemple.
Cet ensemble de règles permet alors de définir la réelle qualité de la donnée concernée.
L’impact d’une mauvaise qualité des données
Les enjeux de la qualité des données sont intrinsèquement liés aux enjeux business de l’entreprise. En effet, la qualité des données est aujourd’hui une problématique capitale pour les entreprises puisqu’elle peut présenter un risque majeur en cas de négligence, pouvant impacter les processus décisionnels, opérationnels, de compliance ou encore son ouverture au digital.
L’impact d’une mauvaise qualité des données sur les processus décisionnels
La plupart des décisions prises dans une organisation se basent sur des chiffres établis à partir d’un volume plus ou moins important. Si ces données ne sont pas suffisamment qualitatives, des projets ou investissements peuvent être lancés sur la base d’informations erronées. A l’inverse, un tableau de bord sur la base d’informations justes et fiables permet une réflexion pertinente et une prise de décision en confiance.
L’impact d’une mauvaise qualité des données sur les processus opérationnels
Une mauvaise Data Quality porte atteinte à la productivité et l’efficacité des entreprises : mauvaise facturation due à une erreur de saisie sur une fiche client, traçabilité défaillante qui ne permet pas de remonter à l’origine d’un problème de fabrication… L’opérationnel devient alors chronophage, puisqu’il y a besoin de constamment vérifier la source du problème et corriger l’information.
L’impact d’une mauvaise qualité des données sur la conformité des entreprises
Dans certains secteurs, les règlementations se font de plus en plus strictes sur la communication de certaines informations auprès de ses clients, consommateurs et partenaires. Prenons l’exemple de la loi Anti-Gaspillage pour une Économie Circulaire (AGEC) : la loi encadre désormais les revendications environnementales des marques, et rend obligatoire l’information du consommateur sur certaines caractéristiques des produits achetés. Une entreprise dont les données seraient de mauvaise qualité peut être en difficulté pour se conformer, que ce soit du fait d’une erreur de l’information communiquée, ou de la difficulté de retracer ces informations dans le système d’information.
L’impact d’une mauvaise qualité des données dans le monde digital
L’avènement du digital a forcé les entreprises à s’ouvrir sur l’extérieur et s’exposer, ne contenant plus leurs informations à leur seule organisation interne : e-commerce, marketplace, site institutionnel… L’utilisation de données peu qualifiées peut alors avoir des effets nocifs sur la réputation d’une entreprise.
À l’inverse, le digital a également permis d’obtenir des données plus fréquemment sur ses clients, tels que les pages web consultées ou encore les commandes passées, permettant une meilleure connaissance de son client, une personnalisation de son expérience avec la marque, et ainsi améliorer son image de marque.
La Data Governance et le Data Management au service de la qualité des données
La Data Governance et le Data Management sont des concepts fortement liés, puisqu’ils sont le pendant l’un de l’autre dans le cycle de vie d’une donnée.
Qu’est-ce que la Data Governance ?
La Data Governance, ou gouvernance des données, rassemble l’ensemble des pratiques et rôles liés à l’obtention, gestion et utilisation des données. Elle confirme la qualité et la sécurité des données dans toute l’entreprise, et détermine les rôles et utilisations de ces données. La volonté de mettre en place une démarche de Data Governance intervient le plus souvent après la prise de conscience des impacts liés à la qualité des données.
La mise en place d’une gouvernance des données n’a pas pour but de changer le mode d’organisation d’une entreprise, mais de définir une politique basée sur la base de processus qui sont fonctionnels. C’est pourquoi on définit trois modèles de gouvernance selon les processus.
- Modèle de gouvernance centralisée : intervient dans le cadre de données produit, où l’information est descendante. Le modèle de gouvernance est plutôt simple, mais comprend des workflows très collaboratifs où beaucoup d’acteurs et métiers interviennent. Le traitement des données est alors centralisé.
- Modèle de gouvernance décentralisée : intervient dans le cadre de données client, où l’information est montante. Ce modèle est plutôt complexe puisqu’il concerne une information qui remonte du terrain et donc de plusieurs points d’entrée. L’objectif de ce modèle de gouvernance est d’identifier le « Golden Record », soit la version d’une donnée que l’on considère être le « Point de Vérité » afin de réalimenter les systèmes avec la bonne information. Le traitement des données est alors décentralisé.
- Modèle de gouvernance fédérée : ce modèle de gouvernance mélange traitement centralisé des données à forte valeur, et traitement décentralisé des données de faible valeur, mais fort volume. Le modèle redistribue les rôles avec une équipe centrale qui coordonne l’ensemble des départements, ces derniers pilotant leur propre gouvernance.
Qu’est-ce que le Data Management ?
Le Data Management, ou gestion des données, réfère à la gestion technique et opérationnelle des données. Cette gestion couvre l’ensemble du cycle de vie des données, incluant la collecte, la validation, le stockage, la protection, le traitement et l’enrichissement des données. L’objectif est d’en assurer la fiabilité et l’accessibilité.
Il y a trois éléments essentiels au Data Management :
- Une architecture de données adaptée : il s’agit de modéliser le cycle de vie des données, notamment la collection et l’utilisation de celles-ci. C’est également dans cette architecture que l’on va intégrer les règles de qualités de ses données.
- Un système de stockage performant : les données doivent être enregistrées et stockées pour qu’elles puissent être exploitées. L’objectif de stocker les données, et surtout bien les stocker, est de les rendre accessibles aux bonnes personnes dans l’entreprise.
- Une bonne sécurité des données : la sécurité des données est essentielle, car en plus d’être une ressource, cette sécurisation peut également être une contrainte légale. Le Data Management doit donc s’assurer à ce que les données soient protégées face à des cyberattaques et conformes aux exigences légales imposées par les règlementations.
Nos partenaires Data Management
La relation entre IA et Data Quality
L’IA peut amener beaucoup. Il peut apprendre, écouter, regarder ce que nous faisons avec nos data, et ainsi devenir un outil essentiel dans l’amélioration de la qualité des données. Que ce soit du contrôle, de la validation ou de l’enrichissement, les tâches qui peuvent se répliquer, l’IA peut accompagner les acteurs de la data.
Contourner les règles déterministes
Dans le domaine exigeant de la Data Quality, où les règles déterministes dictent souvent les normes, l’introduction de l’IA représente une évolution majeure. Généralement, les processus de contrôle qualité sont limités par des règles prédéfinies. L’IA, en revanche, offre une approche moins déterministe, capable d’apprendre de nouvelles règles au fur et à mesure. Cette adaptabilité permet d’améliorer significativement la qualité des données, notamment dans le traitement de volumes importants. La véritable valeur réside dans la capacité de l’IA à s’ajuster dynamiquement et à apprendre des erreurs passées, offrant ainsi une solution agile pour relever les enjeux de validation et de contrôle qualité.
Les enjeux liés à la qualité des données et au contrôle sont considérables. L’intégration de l’IA constitue une réponse stratégique à ces défis. En permettant à l’IA d’apprendre et d’appliquer de nouvelles règles, les entreprises peuvent garantir un niveau de qualité supérieure, particulièrement dans le contexte du traitement de larges volumes de données. Cette approche favorise non seulement l’efficacité opérationnelle, mais aussi une amélioration continue de la qualité des données, renforçant ainsi la fiabilité des informations et facilitant des prises de décision plus éclairées.
L’enrichissement des données grâce à l’IA
L’enrichissement des données joue un rôle crucial dans l’amélioration et le complément des informations existantes, particulièrement important dans le domaine des données produit. Des données exhaustives ne sont pas seulement essentielles pour une gestion optimale des produits, mais également pour une expérience client enrichissante. Qualifier des milliers de produits avec des attributs tels que dimension, couleur et poids peut devenir une tâche fastidieuse et sujette à des erreurs. Néanmoins, les avancées dans les IA génératives offrent une solution en facilitant la mise en œuvre de ce processus, en générant des descriptions de produits ou des argumentaires marketing à partir d’une base de données solide.
L’importance de la bonne qualité des données pour se lancer dans l’IA
La connexion entre l’IA et la qualité des données s’établit dans les deux sens : l’IA peut contribuer au maintien d’une qualité de données élevée, tout en soulignant que la qualité des données est cruciale pour une collaboration efficace avec l’IA. Que ce soit pour l’enrichissement ou la génération d’informations, il demeure essentiel de reconnaître que l’IA nécessite une alimentation en informations afin d’apprendre et de comprendre ses tâches.
Il est important de considérer l’IA comme un outil, un algorithme mis à la disposition des professionnels. Par conséquent, son efficacité dépend de son alimentation correcte : si des informations incorrectes sont fournies à l’IA, il est logique qu’elle génère des éléments de moindre qualité.
Les acteurs de la Data Quality
La sensibilité à la qualité des données au sein d’une entreprise repose sur ceux qui les utilisent au quotidien. Les équipes marketing, responsables des campagnes, la production, axée sur la fabrication, le digital, dédié à la diffusion d’informations, ainsi que la finance, orientée vers le pilotage, sont tous des acteurs clés responsables de la qualité des données qu’ils intègrent dans les systèmes d’information.
Pour ces équipes métiers, la qualité d’une donnée peut être perçue comme un aspect subjectif qui ne prend de l’importance qu’au moment où un processus spécifique la consomme. Ce n’est qu’à ce stade que la question de la qualité ou de la non-qualité de la donnée se concrétise, soulignant l’importance cruciale de garantir des données fiables et précises pour des opérations efficaces au sein de l’entreprise.
L’évolution des mentalités autour de la qualité des données
L’évolution des mentalités concernant la qualité des données a connu un changement significatif. Lorsqu’une entreprise grandit de manière empirique, souvent par l’association de plusieurs entités, chaque entité peut posséder des données de bonne qualité, mais l’absence de partage et de liens entre les référentiels peut conduire à une mauvaise qualité transversale, entraînant la présence de doublons.
Avec la croissance des entreprises, l’approche empirique, souvent basée sur des outils tels qu’Excel, atteint ses limites. Ce qui était gérable au début devient rapidement ingérable à mesure que la quantité de données augmente, soulignant la nécessité d’une approche plus systématique.
Également, les enjeux de conformité, tels que le Règlement Général sur la Protection des Données (RGPD), ont poussé les entreprises à se questionner sur la documentation et la mesure de la qualité des données. Il est devenu crucial de dépasser la simple conformité et de considérer les données comme une valeur essentielle pour une efficacité globale de l’entreprise.
Le Change Management pour accompagner la mise en place de la Data Quality
Le Change Management joue un rôle essentiel dans l'accompagnement de la mise en place de la Data Quality au sein d'une entreprise. La réussite de toute initiative liée à la qualité des données dépend en grande partie de la manière dont les employés adoptent et intègrent ces changements dans leurs pratiques quotidiennes.
Il est impératif de sensibiliser les équipes aux avantages de la Data Quality, en mettant en évidence comment des données fiables contribuent à des processus plus efficaces, à des prises de décision informées et à une meilleure performance globale de l'entreprise.
L’adhésion des collaborateurs est un aspect central du Change Management dans le contexte de la Data Quality. Il s’agit de sensibiliser les équipes aux impacts positifs de la qualité des données sur leurs activités quotidiennes et de les impliquer activement dans le processus. L’écoute des préoccupations, la création d’un environnement propice à l’apprentissage, et la reconnaissance des efforts consentis sont des éléments clés pour instaurer une transition réussie vers une culture d’entreprise où la qualité des données est perçue comme une priorité stratégique.
Ils nous font confiance
"La qualité des données est le socle fondamental des processus opérationnels. Dans un monde numérique en constante évolution, la Data Governance et le Data Management sont les gardiens de cette qualité, définissant des règles et des processus qui transcendent les frontières organisationnelles. En intégrant l'IA de manière stratégique, nous repoussons les limites des règles déterministes traditionnelles, offrant une agilité inégalée dans la gestion et l'amélioration continue de la qualité des données."
Micropole
En résumé
La qualité des données est essentielle pour le succès des entreprises, impactant des secteurs clés tels que le marketing, la finance et la production. La “Data Quality” vise à assurer la fiabilité des données du système d’information, mesurée à travers des règles techniques et métier. Une mauvaise qualité des données peut avoir des répercussions significatives sur les processus décisionnels, opérationnels, de conformité et sur la réputation et l’efficacité digitale de l’entreprise.
L’intégration de l’IA dans la gestion de la qualité des données représente une avancée majeure, permettant de contourner les règles déterministes traditionnelles. L’IA peut enrichir les données, améliorant la gestion des produits et l’expérience client. La relation entre l’IA et la qualité des données est bidirectionnelle, nécessitant une alimentation correcte en données de qualité pour assurer une utilisation efficace de l’IA.
Les acteurs clés responsables de la qualité des données au sein d’une entreprise sont ceux qui les consomment, tels que les équipes marketing, finance, production et digital. L’évolution des mentalités autour de la qualité des données est devenue cruciale, notamment avec des exigences de conformité de plus en plus strictes. Le Change Management joue un rôle essentiel dans l’adhésion des acteurs et la compréhension de l’impact de la démarche de Data Quality.