Articles

Hvad er Data Dictionary – data terminologi

Data dictionary er en oversigt over dataelementer i en database eller datamodel med detaljeret beskrivelse af dens format, relationer, betydning, kilde og brug.

Active and passive data dictionary

Du kan klassificere data dictionary i to hovedkategorier:

  1. Active data dictionary – er en del af og administreres af DBMS.
  2. passiv data ordbog – er ikke en del af og administreres af DBMS.

Active data dictionary

hver ændring i databasestrukturen (ved hjælp af DDL – Data Definition Language) afspejles automatisk i active data dictionary.

Lær mere om active data dictionary

Passive data dictionary

Passive data dictionary er adskilt fra databasen, og alle ændringer i databasestrukturen skal anvendes i passive data dictionary manuelt eller med dedikeret program.

passiv dataordbog kan tage forskellige former:

  1. et dokument eller regneark
  2. værktøjer

    • datakataloger
    • dataintegration/ETL metadata repositories
    • datamodelleringsværktøjer
  3. brugerdefinerede implementeringer

Lær mere om passiv data ordbog

elementer af Data ordbog

data Dictionary er en tabel med dataelementer (kolonner) som rækker og deres attributter som kolonner. Specifikke attributter varierer afhængigt af formålet med dataordbogen.

væsentlige elementer

data ordbog har 2 væsentlige elementer:

  1. liste over tabeller (eller enheder)
  2. liste over kolonner (eller felter eller attributter)

Minimum data dictionary:

DBMS data dictionary

Relationsdatabasemotorer muliggør meget mere beskrivelse af datamodeller og giver disse oplysninger gennem deres dataordbøger. Disse oplysninger er:

  • datatype af kolonne,
  • standardværdier for kolonner,
  • ugyldighed af kolonner,
  • Tabelforhold (udenlandske nøgler),
  • entydighed af kolonneværdier (primære og unikke nøgler),
  • dataelements descriptions

udvidet dataordbog

der er flere attributter for hver tabel eller kolonne, som arkitekter, teams eller organisationer måske vil indsamle, der ikke understøttes af databasemotorer. Det hele afhænger af formålet med dataordbogen. Disse attributter kunne være:

  • kilde,
  • betydning og formål,
  • brug,
  • indeholder følsomme data,
  • liste over værdier,
  • Strengformater,
  • UI form label,
  • ejer,

for at nævne nogle få.

i sådanne tilfælde kan teams indsamle disse oplysninger i eksternt dokument eller dedikeret program (kaldet dataordbogsværktøj, metadatalager, datakatalog).

funktioner i Data Dictionary

Data dictionary kan bruges til forskellige formål. Disse centrale formål er:

Dataordbog i databasesystemer (DBMS)

alle større relationsdatabasestyringssystemer gemmer oplysninger om datastrukturer i en speciel struktur – foruddefinerede tabeller eller visninger, der indeholder metadata om hvert element i en database – tabeller, kolonner, indekser, udenlandske nøgler, begrænsninger og så videre.

denne type dataordbog tjener det formål at give information til brugere og værktøjer om databaseskemaet – alle elementer i datamodel og programmer.

Lær mere:

  • Dataordbog i relationsdatabaser
  • Gennemse katalog over forespørgsler til dataordbog over relationsdatabaser

datamodellering

Dataordbog kan bruges som et værktøj til at modellere data. Dette kan gøres med dedikeret datamodelleringsværktøj eller almindeligt regneark eller dokument. I dette tilfælde fungerer Data dictionary som en specifikation af enheder og deres felter og hjælper forretningsanalytikere, emneeksperter og arkitekter med at samle krav og modellere domænet. Fysisk database og applikation er derefter designet og implementeret baseret på dette dokument.

dokumentation

Dataordbog kan også bruges som reference og katalogisering af eksisterende dataaktiver – tabeller i databaser, regneark, filer og så videre.

dette kan opnås med et par formater og værktøjer:

  • read only HTML eller PDF eksport fra DBMS med databaseværktøjer
  • manuelt udarbejdet og vedligeholdt regneark,
  • datamodelleringsværktøjer med brug af reverse engineering,
  • databasedokumentationsværktøjer,
  • Metadata repositories/datakataloger

Forms of Data Dictionary

Dataordbøger findes i et par forskellige former:

DBMS data dictionary H3>

den mest almindelige forekomst af dataordbog er den, der er indbygget i de fleste databasesystemer, ofte omtalt som dataordbog, systemkatalog eller systemtabeller.

dokument

Dataordbog kan være i en form et tekst-eller HTML-dokument eller regneark, løsrevet fra enhver fysisk datakilde. Vi kan yderligere opdele denne formular i:

  • manuelt dokument – tekstdokument eller et regneark, oprettet og vedligeholdt manuelt, brugt til modellering eller dokumentation,
  • statisk eksporteret dokument – normalt HTML eller PDF-dokument genereret automatisk fra databaseskema med et værktøj eller datamodeller.

Metadata repository

organisationer, der er modne i deres data governance implementere særlige programmer, der udtrækker, administrerer og giver adgang til data ordbog af data aktiver i flere databaser. Dette program kan kaldes Metadata Repository (bredere sigt) eller datakatalog (mere specifik og trending koncept).

Dataordbog i databasens livscyklus

diagrammet nedenfor viser, hvor dataordbog vises i processen med design, styring og dokumentation af databaser.