Articles

Was ist Datenwörterbuch – Datenterminologie

Datenwörterbuch ist eine Bestandsaufnahme der Datenelemente in einer Datenbank oder einem Datenmodell mit detaillierter Beschreibung des Formats, der Beziehungen, der Bedeutung, der Quelle und der Verwendung.

Aktives und passives Datenwörterbuch

Sie können das Datenwörterbuch in zwei Hauptkategorien einteilen:

  1. Aktives Datenwörterbuch – ist Teil von DBMS und wird von DBMS verwaltet.
  2. Passives Datenwörterbuch – ist nicht Teil des DBMS und wird von diesem verwaltet.

Active data dictionary

Jede Änderung in der Datenbankstruktur (mit DDL – Data Definition Language) wird automatisch in Active Data Dictionary reflektiert.

Erfahren Sie mehr über aktives Datenwörterbuch

Passives Datenwörterbuch

Passives Datenwörterbuch ist von der Datenbank getrennt und alle Änderungen in der Datenbankstruktur müssen manuell oder mit einer speziellen Software im passiven Datenwörterbuch vorgenommen werden.

Passives Datenwörterbuch kann verschiedene Formen annehmen:

  1. Ein Dokument oder eine Tabelle
  2. Werkzeuge

    • Datenkataloge
    • Datenintegration/ETL-Metadaten-Repositories
    • Datenmodellierungstools
  3. Benutzerdefinierte Implementierungen

Erfahren Sie mehr über passive Data dictionary

Elements of Data Dictionary

Data dictionary ist eine Tabelle mit Datenelementen (Spalten) als Zeilen und deren Attributen als Spalten. Spezifische Attribute variieren je nach Zweck des Datenwörterbuchs.

Wesentliche Elemente

Data Dictionary hat 2 wesentliche Elemente:

  1. Liste der Tabellen (oder Entitäten)
  2. Liste der Spalten (oder Felder oder Attribute)

Minimales Datenwörterbuch:

DBMS-Datenwörterbuch

Relationale Datenbank-Engines ermöglichen eine viel genauere Beschreibung von Datenmodellen und stellen diese Informationen über ihre Datenwörterbücher bereit. Diese Informationen sind:

  • Datentyp der Spalte,
  • Standardwerte für Spalten,
  • Nullfähigkeit der Spalten,
  • Tabellenbeziehungen (Fremdschlüssel),
  • Eindeutigkeit der Spaltenwerte (Primärschlüssel und eindeutige Schlüssel),
  • Beschreibungen der Datenelemente

Erweitertes Datenwörterbuch

Für jede Tabelle oder Spalte, die Architekten, Teams oder Organisationen erfassen möchten, gibt es weitere Attribute, die von Datenbankmodulen nicht unterstützt werden. Es hängt alles vom Zweck des Datenwörterbuchs ab. Diese Attribute könnten sein:

  • Quelle,
  • Bedeutung und Zweck,
  • Verwendung,
  • Enthält sensible Daten,
  • Werteliste,
  • Zeichenfolgenformate,
  • UI-Formularetikett,
  • Eigentümer,

um nur einige zu nennen.

In einem solchen Fall können Teams diese Informationen in einem externen Dokument oder einer dedizierten Software (bezeichnet als Data Dictionary Tool, metadata Repository, Data Catalog) sammeln.

Funktionen des Datenwörterbuchs

Das Datenwörterbuch kann für verschiedene Zwecke verwendet werden. Diese Hauptziele sind:

Datenwörterbuch in Datenbanksystemen (DBMS)

Alle wichtigen relationalen Datenbankverwaltungssysteme speichern Informationen über Datenstrukturen in speziellen Strukturen – vordefinierte Tabellen oder Ansichten, die Metadaten zu jedem Element einer Datenbank enthalten – Tabellen, Spalten, Indizes, Fremdschlüssel, Einschränkungen und so weiter.

Diese Art von Datenwörterbuch dient dazu, Benutzern und Tools Informationen über das Datenbankschema bereitzustellen – alle Elemente des Datenmodells und der Programme.

Mehr erfahren:

  • Datenwörterbuch in relationalen Datenbanken
  • Durchsuchen Sie den Katalog der Abfragen zum Datenwörterbuch relationaler Datenbanken

Datenmodellierung

Das Datenwörterbuch kann als Werkzeug zum Modellieren von Daten verwendet werden. Dies kann mit einem speziellen Datenmodellierungstool oder einer einfachen Tabelle oder einem Dokument erfolgen. In diesem Fall dient Data Dictionary als Spezifikation von Entitäten und ihren Feldern und hilft Business Analysten, Fachexperten und Architekten, Anforderungen zu sammeln und die Domäne zu modellieren. Die physische Datenbank und Anwendung wird dann basierend auf diesem Dokument entworfen und implementiert.

Dokumentation

Data Dictionary kann auch als Referenz und Katalogisierung vorhandener Datenbestände verwendet werden – Tabellen in Datenbanken, Tabellenkalkulationen, Dateien usw.

Dies kann mit einigen Formaten und Tools erreicht werden:

  • Nur-Lese-HTML- oder PDF-Exporte aus DBMS mit Datenbanktools
  • Manuell vorbereitete und gepflegte Tabellenkalkulationen,
  • Datenmodellierungstools unter Verwendung von Reverse Engineering,
  • Datenbankdokumentationstools,
  • Metadaten-Repositories / Datenkataloge

Formen des Datenwörterbuchs

Datenwörterbücher gibt es in verschiedenen Formen:

DBMS Data dictionary

Das häufigste Vorkommen von Datenwörterbüchern ist das in den meisten Datenbanksystemen integrierte, das häufig als Datenwörterbuch, Systemkatalog oder Systemtabellen bezeichnet wird.

Document

Data Dictionary kann in einer Form ein Text-oder HTML-Dokument oder Tabellenkalkulation, losgelöst von jeder physischen Datenquelle. Wir können dieses Formular weiter aufteilen in:

  • Manuelles Dokument – Textdokument oder eine Tabelle, manuell erstellt und gepflegt, zur Modellierung oder Dokumentation verwendet,
  • Statisches exportiertes Dokument – normalerweise HTML- oder PDF-Dokument, das automatisch aus dem Datenbankschema mit einem Tool oder Datenmodellen generiert wird.

Metadaten-Repository

Organisationen, die in ihrer Data Governance ausgereift sind, implementieren eine spezielle Software, die das Datenwörterbuch von Datenbeständen in mehreren Datenbanken extrahiert, verwaltet und darauf zugreift. Diese Software kann als Metadaten-Repository (breiterer Begriff) oder Datenkatalog (spezifischeres und Trending-Konzept) bezeichnet werden.

Datenwörterbuch im Datenbanklebenszyklus

Das folgende Diagramm zeigt, wo das Datenwörterbuch im Prozess des Entwurfs, der Verwaltung und der Dokumentation von Datenbanken angezeigt wird.