Articles

datové modelování

zjistěte, jak datové modelování používá abstrakci k reprezentaci a lepšímu pochopení povahy toku dat v podnikovém informačním systému

co je to datové modelování?

datové modelování je proces vytváření vizuální reprezentace celého informačního systému nebo jeho částí pro komunikaci spojení mezi datovými body a strukturami. Cílem je znázornit typy dat použity a uloženy v systému, vztahy mezi těmito typy dat, způsoby, jak data mohou být seskupeny a organizované a její formáty a atributy.

datové modely jsou postaveny na obchodních potřebách. Pravidla a požadavky jsou definovány předem prostřednictvím zpětné vazby od podnikatelských subjektů, takže mohou být začleněny do designu nového systému nebo přizpůsobit v iteraci stávající.

Data lze modelovat na různých úrovních abstrakce. Proces začíná shromažďováním informací o obchodních požadavcích od zúčastněných stran a koncových uživatelů. Tato obchodní pravidla jsou pak přeloženy do datových struktur formulovat konkrétní návrh databáze. Datový model lze porovnat s plánem, plánem architekta nebo jakýmkoli formálním schématem, který usnadňuje hlubší pochopení toho, co se navrhuje.

datové modelování využívá standardizované schémata a formální techniky. To poskytuje společný, konzistentní a předvídatelný způsob definování a správy datových zdrojů v celé organizaci, nebo dokonce i mimo ni.

V ideálním případě jsou datové modely živými dokumenty, které se vyvíjejí spolu s měnícími se obchodními potřebami. Hrají důležitou roli při podpoře obchodních procesů a plánování IT architektury a strategie. Datové modely lze sdílet s dodavateli, partnery a / nebo kolegy z oboru.

typy datových modelů

stejně jako jakýkoli proces návrhu, Návrh databázového a informačního systému začíná na vysoké úrovni abstrakce a stává se stále konkrétnější a konkrétnější. Datové modely lze obecně rozdělit do tří kategorií, které se liší podle stupně abstrakce. Proces začíná koncepčním modelem, postupuje k logickému modelu a končí fyzickým modelem. Každý typ datového modelu je podrobněji popsán níže:

  • koncepční datové modely. Oni jsou také označovány jako domény, modely a nabídnout širší pohled na to, co systém bude obsahovat, jak bude organizována, a které obchodní pravidla jsou zapojeny. Koncepční modely jsou obvykle vytvářeny jako součást procesu shromažďování počátečních požadavků na projekt. Typicky, oni jsou entity třídy (vymezení typů věcí, které jsou důležité pro podnikání představují v datovém modelu), jejich vlastnosti a omezení, vztahy mezi nimi a příslušnou bezpečnost a integrita údajů a požadavky. Jakákoli notace je obvykle jednoduchá.
    Diagram Konceptuální Datový Model
  • Logické datové modely. Jsou méně abstraktní a poskytují podrobnější informace o pojmech a vztazích v dané oblasti. Následuje jeden z několika formálních datových modelovacích notačních systémů. Označují datové atributy, jako jsou datové typy a jejich odpovídající délky, a ukazují vztahy mezi entitami. Logické datové modely nespecifikují žádné technické systémové požadavky. Tato fáze je často vynechána v postupech agile nebo DevOps. Logické datové modely mohou být užitečné ve vysoce provádění procesních prostředích, nebo pro projekty, které jsou data-orientované povahy, jako jsou data warehouse design či systém hlášení rozvoje.
    Diagram Logického Datového Modelu
  • Fyzické datové modely. Poskytují schéma, jak budou data fyzicky uložena v databázi. Jako takový, jsou nejméně abstraktní ze všech. Nabízejí jasný design, který může být realizován jako relační databáze, včetně asociativní tabulky, které ilustrují vztahy mezi subjekty, stejně jako primární klíče a cizí klíče, které budou použity k udržení těchto vztahů. Fyzické datové modely mohou zahrnovat vlastnosti specifické pro systém správy databází (DBMS), včetně ladění výkonu.
    Diagram Fyzického Datového Modelu

Data modelování procesu

Jako disciplína, modelování dat vyzývá zúčastněné strany, aby vyhodnocení dat, zpracování a skladování v usilovné detail. Techniky modelování dat mají různé konvence, které určují, které symboly se používají k reprezentaci dat, jak jsou modely stanoveny a jak jsou přenášeny obchodní požadavky. Všechny přístupy poskytují formalizované pracovní postupy, které zahrnují sled úkolů, které mají být provedeny iterativním způsobem. Tyto pracovní postupy obecně vypadají takto:

  1. Identifikujte entity. Proces modelování dat začíná identifikací věcí, událostí nebo konceptů, které jsou zastoupeny v datovém souboru, který má být modelován. Každá entita by měla být soudržná a logicky diskrétní od všech ostatních.
  2. Identifikujte Klíčové vlastnosti každé entity. Každý typ entity lze odlišit od všech ostatních, protože má jednu nebo více jedinečných vlastností, nazývaných atributy. Například účetní jednotka jmenuje „zákazník“ by mohl mít takové atributy jako jméno, příjmení, telefonní číslo a oslovení, zatímco subjekt s názvem „adresa“ může obsahovat název ulice a číslo, město, stát, země a psč.
  3. Identifikujte vztahy mezi entitami. Nejčasnější návrh datového modelu určí povahu vztahů, které má každá entita s ostatními. Ve výše uvedeném příkladu každý zákazník „žije“ na adrese. Pokud by byl tento model rozšířen tak, aby zahrnoval entitu nazvanou „objednávky“, Každá objednávka by byla odeslána a účtována také na adresu. Tyto vztahy jsou obvykle dokumentovány pomocí unified modeling language (UML).
  4. mapa atributy entit zcela. To zajistí, že model odráží, jak bude podnik data používat. Několik formálních modelů modelování dat je široce používáno. Objektově orientovaní vývojáři často používají vzory analýzy nebo vzory návrhu, zatímco zúčastněné strany z jiných obchodních domén se mohou obrátit na jiné vzory.
  5. přiřaďte klíče podle potřeby a rozhodněte se o stupni normalizace, který vyvažuje potřebu snížit redundanci s požadavky na výkon. Normalizace je technika pro organizaci dat modelů (a databází, které zastupují), ve které číselné identifikátory, tzv. klíče, jsou přiřazeny do skupin dat představují vztahy mezi nimi bez opakování údajů. Například, pokud jsou zákazníci každý přidělen klíč, ten klíč může být spojeno s jejich adresy a jejich pořadí historie, aniž by museli opakovat informace v tabulce jména zákazníků. Normalizace má tendenci snižovat množství úložného prostoru, který bude databáze vyžadovat,ale může za cenu výkonu dotazu.
  6. dokončete a ověřte datový model. Modelování dat je iterativní proces, který by se měl opakovat a vylepšovat, jak se mění obchodní potřeby.

typy datového modelování

datové modelování se vyvinulo společně se systémy správy databází, přičemž typy modelů rostly se složitostí, jak rostly potřeby ukládání dat podniků. Zde je několik typů modelů:

  • hierarchické datové modely představují vztahy one-to-many ve formátu treelike. V tomto typu modelu má každý záznam jeden kořen nebo rodič, který mapuje jednu nebo více podřízených tabulek. Tento model byl implementován do systému IBM Information Management System (IMS), který byl představen v roce 1966 a rychle našel široké využití, zejména v bankovnictví. Ačkoli je tento přístup méně účinný než nedávno vyvinuté databázové modely, stále se používá v systémech Extensible Markup Language (XML) a geografických informačních systémech (GISs).
  • relační datové modely byly původně navrženy výzkumníkem IBM E. F. Codd v roce 1970. Jsou stále implementovány v mnoha různých relačních databázích běžně používaných v podnikových výpočtech. Modelování relačních dat nevyžaduje podrobné pochopení fyzikálních vlastností použitého úložiště dat. V něm jsou datové segmenty explicitně spojeny pomocí tabulek, což snižuje složitost databáze.

relační databáze často používají strukturovaný dotazovací jazyk (SQL)pro správu dat. Tyto databáze fungují dobře pro udržení integrity dat a minimalizaci redundance. Často se používají v prodejních systémech, stejně jako pro jiné typy zpracování transakcí.

  • Entity-relationship (ER) datové modely používají formální diagramy k reprezentaci vztahů mezi entitami v databázi. Několik nástrojů pro modelování ER používají datoví architekti k vytváření vizuálních map, které zprostředkovávají cíle návrhu databáze.
  • Objektově orientované datové modely impulz jako objektově orientované programování, a to stalo se populární v polovině-1990. „Objekty“ zapojeni jsou abstrakcí z reálného světa entity. Objekty jsou seskupeny do hierarchií tříd a mají přidružené funkce. Objektově orientované databáze mohou obsahovat tabulky, ale mohou také podporovat složitější datové vztahy. Tento přístup se používá v multimediálních a hypertextových databázích, stejně jako v jiných případech použití.
  • Dimenzionální datové modely byly vyvinuty podle Ralpha Kimballa, a byly navrženy tak, aby optimalizovat načítání dat rychlostí pro analytické účely v datovém skladu. Zatímco relační a ER modely zdůrazňují efektivní ukládání, trojrozměrné modely, zvýšení redundance, aby bylo snazší najít informace pro podávání zpráv a vyhledávání. Toto modelování se obvykle používá napříč systémy OLAP.

Dvě populární dimenzionální datové modely jsou star schema, ve kterém jsou data uspořádána do faktů (měřitelné položky) a rozměry (referenční informace), kde každý fakt je obklopen jeho přidružené rozměry v hvězda-jako vzor. Druhým je schéma sněhové vločky, které se podobá hvězdnému schématu, ale obsahuje další vrstvy přidružených rozměrů, což komplikuje větvení.

Výhody modelování dat

modelování Dat dělá to jednodušší pro vývojáře, datové architekty, business analytiky, a další zúčastněné strany, aby zobrazit a pochopit vztahy mezi údaji do databáze nebo datového skladu. Kromě toho může:

  • snížit chyby ve vývoji softwaru a databáze.
  • Zvyšte konzistenci dokumentace a návrhu systému v rámci celého podniku.
  • zlepšit výkon aplikací a databází.
  • usnadňuje mapování dat v celé organizaci.
  • zlepšit komunikaci mezi vývojáři a business intelligence týmy.
  • usnadňuje a urychluje proces návrhu databáze na koncepční, logické a fyzické úrovni.

nástroje pro modelování dat

četné komerční a open source počítačově podporované softwarové inženýrství (CASE) řešení jsou široce používány dnes, včetně více datových modelování, diagramů a vizualizačních nástrojů. Zde je několik příkladů:

  • erwin Data Modeler je modelování dat nástroj založený na Integraci Definice pro informační modelování (IDEF1X) data modeling language, který nyní podporuje i jiné notace metodik, včetně dimenzionální přístup.
  • Enterprise Architect je vizuální modelování a navrhování nástroj, který podporuje modelování podnikových informačních systémů a architektur, stejně jako softwarových aplikací a databází. Je založen na objektově orientovaných jazycích a standardech.
  • ER / Studio je návrh databáze software, který je kompatibilní s několika dnešních nejpopulárnějších systémů pro správu databází. Podporuje relační i dimenzionální modelování dat.
  • volné nástroje pro modelování dat zahrnují řešení s otevřeným zdrojovým kódem, jako je Open ModelSphere.

Data modelování a IBM Cloud

Výzkumníci v IBM byli mezi průkopníky, kteří vytvořili první hierarchické a relační datové modely a také navržen tak, databází, kde tyto modely byly zpočátku realizovány.

Dnes, IBM Cloud poskytuje full stack platformě, která podporuje bohaté portfolio SQL a NoSQL databází, spolu s vývojářské nástroje potřebné pro správu datových zdrojů v nich efektivně. IBM Cloud také podporuje nástroje s otevřeným zdrojovým kódem, které vývojářům pomáhají spravovat ukládání dat objektů, souborů a bloků za účelem optimalizace výkonu a spolehlivosti.

Chcete se dozvědět více o modelování dat v IBM Cloud? Zaregistrujte si IBMid a vytvořte si svůj bezplatný účet IBM Cloud ještě dnes.