mardi 14 octobre 2014

Dark data : exploitez-les grâce au Big Data !

Les Dark data sont un véritable gisement pour les entreprises Par David-Stéphane Fala, directeur conseil, Practice Big Data & Mobilité de Micropole

Le volume des données numériques double tous les ans et représente désormais près de 98 % des informations dans le monde… L’heure est au Big Data, porteur de valeur pour les données externes, mais aussi pour les données internes non exploitées, ou Dark data, qui sont un véritable gisement pour les entreprises. À la clé : une véritable source d’économies et de réels gains de productivité.

 

Tous les jours, 2,5 trillions d’octets de données sont générées dans le monde, selon IBM. Conséquence : 90 % des données existantes aujourd’hui ont ainsi été créées au cours des deux dernières années... Et parmi cette masse d’informations  certaines produites par l’entreprise ne sont pas exploitées, soit par manque de moyens financiers soit par méconnaissance. Or, ces Dark data possèdent une vraie valeur intrinsèque pour l’entreprise et constituent une mine d’informations opérationnelles qu’il ne faut pas négliger.

 

Comment catégoriser ces Dark data ?

Il existe 3 raisons pour lesquelles ces données ‘obscures’ restent très peu exploitées à ce jour :

1) Les données non identifiées qui ne sont donc pas collectées,

2) Les données qui sont identifiées, mais trop difficiles à exploiter avec les technologies classiques,

3) Les données sont disponibles au sein du SI, mais non exploitables en l'état.

Mais heureusement, ces Dark data fonctionnent à l'inverse de la matière noire (Dark Matter), il est possible de les identifier, de les quantifier et de les rendre exploitable, pour en envisager les bénéfices.

 

Replacer la DSI au centre de l’entreprise et de ses performances

Dans un rapport de 2010, McKinsey prédisait une augmentation de 60 % de la marge d’exploitation des retailers qui utiliseraient pleinement ces Big Data : imaginez alors les possibilités offertes par l’exploitation des données internes non ou peu exploitées ! Comment alors intégrer l’ensemble de ces données non métier, produites par l‘entreprise ou la DSI, et leur donner du sens ? Grâce au Big Data ! Aujourd’hui, il est désormais possible de stocker ces données et donc de les analyser.

 

Quelles conséquences directes pour l’entreprise ?

La problématique essentielle liée aux Dark data (après le travail d'identification) est lié à leur volumétrie conséquente et à la variété de leur format.

Le Big Data apporte la possibilité de mieux connecter les systèmes de production au système d’information en apportant les outils permettant l'exploitation des données de type "machine" (log, capteurs, archives, etc.). À la clé pour la DSI : une diminution des coûts et une capacité d’analyse inégalable. L’avantage ? Pouvoir intervenir de manière proactive sur les machines et réduire ainsi les temps d’arrêt. Désormais, la DSI va pouvoir obtenir une vision globale de ce qui est produit et intégrer l’ensemble des informations à la plate-forme, ce qui va ainsi améliorer son ROI.

 

Les possibilités semblent infinies : impliquer d’autres projets et d’autres métiers sur la plate-forme, interconnecter différents systèmes, relier et connecter les capteurs présents dans les systèmes de production... La DSI peut alors exploiter les logs, ces journaux d’activités produits par les applications ou les outils de production, et ainsi anticiper les problèmes. À la clé : un downtime réduit et des gains de productivité conséquents.

 

Une connaissance pointue du système

La phase de cadrage en amont est essentielle. En effet, il s’avère indispensable de tirer la meilleure connaissance possible du système pour estimer au plus près l’impact de ces données. C’est pourquoi il est essentiel d’impliquer les collaborateurs compétents dans ce projet. La DSI se pose alors en moteur de l’activité de l’entreprise. Ensuite, il faut avancer au cas par cas en fonction des métiers, des secteurs… Pour exemple un projet de ce type , récemment mis en place chez un constructeur automobile, dont l'une des chaînes de montage tombait régulièrement en panne. Après analyse des logs des capteurs, il a été établi qu’une surchauffe anormale d'un ensemble de robots causait ces pannes. D’où l’intérêt d’intégrer ces données urgemment pour définir précisément la cause des problèmes rencontrés et les anticiper. Un gage essentiel de compétitivité pour toute entreprise.