Stratégie de données

Dans son livre blanc The 5 Essential Components of a Data Strategy, SAS fournit une explication succincte de ce qu'est la stratégie de données et fournit une explication de ses 5 composants.

Ci-dessous je présent un résumé de ce livre blanc.

Qu'est-ce que la stratégie de données?

Les données sont un actif de l'entreprise. Les données sont un atout essentiel qui permet la prise de décisions et elles nécessitent alors une stratégie globale. Une stratégie de données aide en garantissant que les données soient gérées et utilisées comme un actif.  Elle fournit un ensemble commun de buts et d'objectifs pour tous les projets afin de garantir que les données soient utilisées de manière efficace et efficiente. Une stratégie de données établit des méthodes, des pratiques et des processus communs pour gérer, manipuler et partager les données dans toute l'entreprise de manière reproductible.  La stratégie de données consiste à planifier comment améliorer toutes les manières dont les données sont acquises, stockées, gérées, partagées et utilisées.

Les 5 composantes d'une stratégie de données

1. Identification

Une stratégie de données doit garantir que toutes les données puissent être identifiées. Il faut identifier les données et comprendre leur signification quelle que soit leur structure, leur origine ou leur emplacement. L'une des constructions les plus fondamentales pour l'utilisation et le partage des données au sein d'une entreprise consiste à établir un moyen d'identifier et de représenter leur contenu. L'établissement de conventions de nommage et de valeur cohérentes pour les éléments de données est essentiel à l'utilisation et au partage des données. Il est également important d'avoir un moyen de référencer et d'accéder aux métadonnées associées aux données (définition, origine, localisation, valeurs de domaine, etc.). Les métadonnées sont essentielles pour l'utilisation des données commerciales, car il est impossible de connaître l'emplacement et la signification de toutes les données commerciales de l'entreprise - des milliers d'éléments de données provenant de nombreuses sources de données.

2. Stockage

On doit conserver les données dans une structure et un emplacement qui permettent un accès et un traitement facile.  Il faut donc avoir un plan pour gérer efficacement le stockage requis pour partager et déplacer les données entre les systèmes. La clé est de s'assurer qu'il existe un moyen pratique de stocker toutes les données créées de manière à ce qu'elles soient facilement accessibles et partagées.  Une bonne stratégie de données garantira que toutes les données créées sont disponibles pour un accès futur sans que chacun ait à créer ses propres copies.

3. Approvisionnement

Les entreprises dépendent du partage et de la distribution des données pour répondre à leurs besoins opérationnels et analytiques. Aujourd'hui, le partage de données n'est certainement pas un besoin spécialisé ou un événement rare - les données sont souvent utilisées par 10 autres systèmes pour prendre en charge des processus métier supplémentaires et des prises de décision . Il faut donc conditionner les données de manière à ce qu'elles puissent être réutilisées et partagées, et il faut également fournir des règles et des directives d'accès aux données. Si les données d'une entreprise sont vraiment un actif d'entreprise, alors toutes les données doivent être conditionnées et préparées pour le partage. Une stratégie de données doit traiter l'approvisionnement des données en tant que processus métier standard.

4. Traitement

Dans la plupart des entreprises, les données proviennent à la fois de sources internes et externes. Les données internes sont générées à partir de dizaines (voire de centaines) de systèmes d'application. Les données externes peuvent provenir de diverses sources (applications cloud, partenaires commerciaux, fournisseurs de données, agences gouvernementales, etc.). Le traitement est la composante de la stratégie de données qui aborde les activités nécessaires pour faire évoluer les données d'un ingrédient brut vers un produit fini. Une stratégie de données doit permettre de déplacer et de combiner des données résidant dans des systèmes disparates et de fournir une vue unifiée et cohérente des données. Pour rendre les données prêtes à l'emploi, une série d'étapes sont nécessaires pour transformer, corriger et formater les données. Le résultat de ce processus est un petit ensemble d'ensembles de données homogènes qui peuvent être fusionnés ou intégrés par un utilisateur de données avec un ensemble de tâches de préparation de données spécifiques à ses besoins individuels (analyse, traitement des transactions, partage de données, etc.).

5. Gouvernance

Le rôle que joue la gouvernance dans une stratégie globale de données est de s'assurer que les données soient gérées de manière cohérente dans l'ensemble de l'entreprise. Une gouvernance efficace des données garantit que les données soient gérées, manipulées et accessibles de manière cohérente. Une bonne stratégie de données doit permettre d'établir, de gérer et de communiquer des politiques et des mécanismes d'information pour une utilisation efficace des données.  La raison de l'établissement d'un processus de gouvernance solide est de s'assurer qu'une fois les données découplées de l'application qui les a créées, les règles et les détails des données soient connus et respectés par tous les autres constituants des données.

Voila donc mon résumé de l'excellent livre blanc.  Ce livre blanc fournit un exemple d'application au domaine des services financiers.  Vous pouvez trouver l'intégralité de ce livre blanc ici.

Est-ce que votre entreprise a établie une stratégie de données comme celle décrite ci-dessus?


Pour en savoir plus sur la science de données, vous pouvez consulter la page Science de données, laquelle est entièrement consacrée à ce fascinant domaine.




Commentaires

Posts les plus consultés de ce blog

Comment les mégadonnées rendent les campagnes de marketing numérique plus efficaces

Principales tendances de l'intelligence artificielle pour 2021

À propos de l'apprentissage profond en tant que sous-ensemble de l'apprentissage automatique et de l'IA