Articles

Qu’est-ce qu’un dictionnaire de données – Terminologie des données

Le dictionnaire de données est un inventaire des éléments de données d’une base de données ou d’un modèle de données avec une description détaillée de son format, de ses relations, de sa signification, de sa source et de son utilisation.

Dictionnaire de données actif et passif

Vous pouvez classer le dictionnaire de données en deux catégories principales:

  1. Dictionnaire de données actif – fait partie et est géré par le SGBD.
  2. Dictionnaire de données passif – ne fait pas partie du SGBD et n’est pas géré par celui-ci.

Dictionnaire de données actif

Chaque modification de la structure de la base de données (en utilisant le langage de définition de données DDL) est automatiquement reflétée dans le dictionnaire de données actif.

En savoir plus sur le dictionnaire de données actif

Dictionnaire de données passif

Le dictionnaire de données passif est séparé de la base de données et toutes les modifications de la structure de la base de données doivent être appliquées manuellement dans le dictionnaire de données passif ou avec un logiciel dédié.

Le dictionnaire de données passif peut prendre différentes formes:

  1. Un document ou une feuille de calcul
  2. Outils

    • Catalogues de données
    • Intégration de données / référentiels de métadonnées ETL
    • Outils de modélisation de données
  3. Implémentations personnalisées

En savoir plus sur le dictionnaire de données passif

Éléments du Dictionnaire de données

Le dictionnaire de données est une table avec des éléments de données (colonnes) sous forme de lignes et leurs attributs sous forme de colonnes. Les attributs spécifiques varient en fonction de l’objectif du dictionnaire de données.

Éléments essentiels

Le dictionnaire de données a 2 éléments essentiels:

  1. Liste des tables (ou entités)
  2. Liste des colonnes (ou champs, ou attributs)

Dictionnaire de données minimum:

Dictionnaire de données SGBD

Les moteurs de base de données relationnelles permettent beaucoup plus de description des modèles de données et fournissent ces informations via leurs dictionnaires de données. Cette information est:

  • Type de colonne de données,
  • Valeurs par défaut pour les colonnes,
  • Nullité des colonnes,
  • Relations de table (clés étrangères),
  • Unicité des valeurs de colonne (clés primaires et uniques),
  • Descriptions des éléments de données

Données étendues dictionary

Il y a plus d’attributs pour chaque table ou colonne que les architectes, les équipes ou les organisations peuvent vouloir collecter et qui ne sont pas pris en charge par les moteurs de base de données. Tout dépend du but du dictionnaire de données. Ces attributs pourraient être:

  • Source,
  • Signification et but,
  • Utilisation,
  • Contient des données sensibles,
  • Liste de valeurs,
  • Formats de chaîne,
  • Étiquette de formulaire d’interface utilisateur,
  • Propriétaire,

pour n’en nommer que quelques-uns.

Dans ce cas, les équipes peuvent collecter ces informations dans un document externe ou un logiciel dédié (appelé outil de dictionnaire de données, référentiel de métadonnées, catalogue de données).

Les fonctions du dictionnaire de données

Le dictionnaire de données peut être utilisé à différentes fins. Ces objectifs clés sont:

Dictionnaire de données dans les systèmes de bases de données (SGBD)

Tous les principaux systèmes de gestion de bases de données relationnelles stockent des informations sur les structures de données dans des structures spéciales – tables prédéfinies ou vues contenant des métadonnées sur chaque élément d’une base de données – tables, colonnes, index, clés étrangères, contraintes, etc.

Ce type de dictionnaire de données sert à fournir des informations aux utilisateurs et aux outils sur le schéma de base de données – tous les éléments du modèle de données et des programmes.

En savoir plus:

  • Dictionnaire de données dans les bases de données relationnelles
  • Parcourir le catalogue des requêtes vers le dictionnaire de données des bases de données relationnelles

Modélisation de données

Le dictionnaire de données peut être utilisé comme outil pour modéliser des données. Cela peut être fait avec un outil de modélisation de données dédié ou une feuille de calcul ou un document ordinaire. Dans ce cas, le dictionnaire de données sert de spécification des entités et de leurs domaines et aide les analystes commerciaux, les experts en la matière et les architectes à rassembler les exigences et à modéliser le domaine. La base de données physique et l’application sont ensuite conçues et implémentées sur la base de ce document.

Documentation

Le dictionnaire de données peut également être utilisé comme référence et catalogage des actifs de données existants – tables dans des bases de données, des feuilles de calcul, des fichiers, etc.

Ceci peut être réalisé avec quelques formats et outils:

  • Exportations HTML ou PDF en lecture seule à partir du SGBD avec des outils de base de données
  • Feuilles de calcul préparées et maintenues manuellement,
  • Outils de modélisation de données avec l’utilisation de la rétro-ingénierie,
  • Outils de documentation de base de données,
  • Dépôts de métadonnées / catalogues de données

Formes de Dictionnaire de données

Les dictionnaires de données existent sous quelques formes différentes:

Dictionnaire de données SGBD

L’occurrence la plus courante du dictionnaire de données est celle intégrée à la plupart des systèmes de base de données, souvent appelée dictionnaire de données, catalogue système ou tables système.

Document

Le dictionnaire de données peut être sous forme de document texte ou HTML ou de feuille de calcul, détaché de toute source de données physique. Nous pouvons également diviser ce formulaire en:

  • Document manuel – document texte ou feuille de calcul, créé et maintenu manuellement, utilisé pour la modélisation ou la documentation,
  • Document exporté statique – généralement un document HTML ou PDF généré automatiquement à partir d’un schéma de base de données avec un outil ou des modèles de données.

Référentiel de métadonnées

Les organisations qui sont matures dans leur gouvernance des données implémentent un logiciel spécial qui extrait, gère et donne accès à un dictionnaire de données des actifs de données dans plusieurs bases de données. Ce logiciel peut être appelé Référentiel de métadonnées (terme plus large) ou Catalogue de données (concept plus spécifique et tendance).

Dictionnaire de données dans le cycle de vie de la base de données

Le diagramme ci-dessous montre où le dictionnaire de données apparaît dans le processus de conception, de gestion et de documentation des bases de données.