La santé des données doit faire l'objet de toutes les attentions
L'utilisation des données, dans le contexte d'augmentation du volume des données, des difficultés d'accès, d'organisation et de tri, aborde de nouveaux défis pour réussir à guider les décisions stratégiques et les résultats des entreprises.
Les entreprises du monde entier ont dû prendre des décisions à un rythme effréné depuis le début de la pandémie, chaque décision impactant leur développement et leur réussite. Dans le contexte de la poursuite de l'expansion du virus, ce n'est pas un mais plusieurs scénarios que doivent anticiper les entreprises, intensifiant ainsi la diversité, la rapidité et le volume de leurs données.
En parallèle, pour pouvoir partager toutes ces données à distance, elles sont de plus en plus nombreuses à migrer. Face à la pression toujours plus forte envers la transformation digitale, les capacités technologiques existantes sont remises en question, contribuant à faire émerger ce qu'on peut appeler un "cloud Covid". L'utilisation des données, dans le contexte d'augmentation du volume des données, des difficultés d'accès, d'organisation et de tri, aborde de nouveaux défis pour réussir à guider les décisions stratégiques et les résultats des entreprises.
Les « dark data » doivent être passées au crible
Le processus de gestion des données en vigueur depuis des décennies se concentre sur le triptyque « collecte, traitement et stockage ». Mais cette logique passe à côté du coeur du problème, à savoir de savoir utiliser les données dans un but précis. Le résultat en est une quantité considérable de données aujourd'hui inutilisées ou non exploitées, plaçant les entreprises dans un environnement numérique de "dark data", c'est-à-dire toxiques et désordonnées, au sein desquelles les entreprises ne savent pas précisément de quel type de données elles disposent, ni leur emplacement, et ignorent même jusqu'à leur existence.
Négliger ces "dark data" n'est pas sans risque. En plus de créer un désavantage concurrentiel parce qu'on n'utilise pas ces données potentiellement précieuses et le coût élevé de leur stockage, il y a également des risques accrus de brèches de sécurité et de violations importantes de la vie privée, et une atteinte possible à la réputation de l'entreprise. Loin d'être insurmontable, des solutions existent pour mettre ces données à la lumière et identifier de nouveaux potentiels.
Aller au-delà du cloud
La mécanique de gestion des données est source de préoccupations et de défis, dus à l'approche fragmentée de la gestion, de l'intégration et du stockage des données adoptée par la plupart des entreprises, et source de silos. En plus de coûter cher et d'être difficile à gérer, à cette approche contribue à « assombrir » les données, et à rendre leur analyse impossible. Quand les données qui alimentent les décisions business quotidiennes sont fiables, conformes et accessibles rapidement en revanche, la question de la validation rapide par les collaborateurs et systèmes situés en première ligne ne se pose pas.
Il est rare que les solutions et plateformes de migration, de collecte, de préparation et de stockage aident les entreprises à mieux comprendre les données dont elles disposent, ou à obtenir de meilleurs résultats. Déplacer des données et les stocker sans tenir compte de leur qualité ou de leur santé contribue à créer une décharge numérique d'informations et à compliquer encore plus le tri qu'il faut faire, au lieu de résoudre les problèmes des clients et de l'entreprise.
Le fait de stocker toujours plus de données ou de les migrer vers le cloud semble être, aux yeux de certaines sociétés de gestion de données, le moyen d'aider les entreprises à surmonter ces défis. Une approche parcellaire de la gestion des données - même à travers le cloud - n'est plus suffisante aujourd'hui, à mesures que les entreprises profitent de gains d'efficacité et des nouvelles plateformes d'analytique dans le cloud pour se réinventer et être toujours plus axées sur les données. Collecter, déplacer et préparer les données plus efficacement dans le cloud ne suffit plus, il faut à présent se concentrer sur l'intégrité des données dans un environnement toujours plus axé sur le cloud.
Définir et maintenir des données saines et de qualité
Les données business, issues de sources internes ou tierces, sont souvent collectées par des saisies manuelles, propices aux erreurs et difficiles à gérer. En outre, les données perdent leur contexte d'origine quand elles sont extraites de leur environnement initial, et cessent de faire partie des habitudes, solutions et bonnes pratiques de leurs utilisateurs réguliers, un élément qui reste souvent ignoré. Il devient problématique ensuite de leur appliquer de nouvelles finalités car leur qualité peut être mauvaise, inexacte, obsolète ou incomplète, et leur accès peut même s'avérer non autorisé (dans le cas des données personnelles).
La santé physique et la santé des données sont très similaires, et prendre soin de la première, tout au long de sa vie, demande une certaine discipline, logistique et un équipement adéquat.
De la même façon qu'un professionnel de santé est essentiel à un système de santé de qualité, les professionnels des données (et leurs utilisateurs) sont des éléments centraux d'un système de santé des données performant. Chaque collaborateur est concerné par la santé des données, d'où l'importance d'adopter une approche généralisée.
Les éléments suivants sont primordiaux pour un bon système de santé des données : l'identification des facteurs de risque pour prévenir les problèmes de sécurité, des programmes de prévention qui normalisent les données pour en faciliter la digestion, l' »inoculation » proactive utilisant les technologies de machine learning pour former les systèmes à reconnaître les données de qualité insuffisante, la surveillance continue pour un diagnostic rapide des données et des évaluations correctes, des protocoles pour un pronostic persistant qui améliore la qualité des données, et des traitements efficaces qui permettent d'équilibrer les risques et les avantages qui en découlent.
« Mieux vaut prévenir que guérir » est un adage qui fonctionne toujours. Mettre en place la santé des données représente le nouveau muscle professionnel requérant beaucoup de travail et impliquant de nouvelles façons de penser. Instaurer une culture d'amélioration continue, en y intégrant les collaborateurs équipés des meilleurs outils permettant de garantir l'intégrité, l'intégration, la gouvernance et l'accessibilité des données, permet de protéger l'entreprise des risques les plus importants et les plus coûteux, tout en optimisant la valeur de ces données.
Pour toutes ces raisons, il est important d'investir rapidement dans la santé des données pour naviguer avec sérénité au sein d'un "cloud Covid" et disposer d'informations exploitables et disponibles en temps voulu.
Sur le même thème
Voir tous les articles Data & IA