Articles

Adat Modellezés

Fedezze fel, hogyan adatok modell használ absztrakció képviseli, illetve, hogy jobban megértsük a természet az adatok áramlását egy vállalati információs rendszer

Mi az adatokat a modellkedést?

az adatmodellezés egy egész információs rendszer vagy annak egy része vizuális ábrázolásának folyamata az adatpontok és struktúrák közötti kapcsolatok kommunikálására. A cél, hogy bemutassuk a rendszerben használt és tárolt adatok típusát, az adattípusok közötti összefüggéseket, az adatok csoportosításának és szervezésének módját, valamint annak formátumát és attribútumait.

az adatmodellek az üzleti igények köré épülnek. A szabályokat és követelményeket előzetesen az üzleti érdekelt felek visszajelzései alapján határozzák meg, így azok beépíthetők egy új rendszer kialakításába, vagy egy meglévő iterációjához igazíthatók.

Az adatok az absztrakció különböző szintjein modellezhetők. A folyamat azzal kezdődik, hogy információkat gyűjtünk az üzleti követelményekről az érdekelt felektől és a végfelhasználóktól. Ezeket az üzleti szabályokat ezután adatstruktúrákba fordítják, hogy konkrét adatbázis-tervezést alakítsanak ki. Az adatmodell összehasonlítható egy ütemtervvel, egy építész tervrajzával vagy bármilyen formális diagrammal, amely megkönnyíti a tervezés mélyebb megértését.

az adatmodellezés standardizált sémákat és formális technikákat alkalmaz. Ez egy közös, következetes és kiszámítható módszer az adatforrások meghatározására és kezelésére egy szervezeten belül, vagy akár azon túl is.

ideális esetben az adatmodellek olyan élő dokumentumok, amelyek a változó üzleti igényekkel együtt fejlődnek. Fontos szerepet játszanak az üzleti folyamatok támogatásában, valamint az informatikai architektúra és stratégia tervezésében. Az adatmodellek megoszthatók beszállítókkal, partnerekkel és/vagy iparági társaikkal.

adatmodellek típusai

mint minden tervezési folyamat, adatbázis és információs rendszer kialakítása magas absztrakciós szinttel kezdődik, és egyre konkrétabbá és specifikusabbá válik. Az adatmodellek általában három kategóriába sorolhatók, amelyek az absztrakció mértékétől függően változnak. A folyamat egy fogalmi modellel kezdődik, egy logikai modell felé halad, majd egy fizikai modellel zárul. Az adatmodell minden típusát az alábbiakban részletesebben tárgyaljuk:

  • fogalmi adatmodellek. Domainmodellként is emlegetik őket, és nagy képet adnak arról, hogy mit tartalmaz majd a rendszer, hogyan szerveződik, és milyen üzleti szabályokról van szó. A koncepcionális modelleket általában a kezdeti projektkövetelmények összegyűjtésének folyamatának részeként hozzák létre. Jellemzően ezek közé tartoznak az entitásosztályok (a vállalkozás számára az adatmodellben fontos dolgok típusának meghatározása), azok jellemzői és korlátai, a köztük lévő kapcsolatok, valamint a vonatkozó biztonsági és adatintegritási követelmények. Minden jelölés általában egyszerű.
    Diagram of a Conceptual Data Model
  • logikai adatmodellek. Ezek kevésbé elvontak, és részletesebb leírást adnak a szóban forgó terület fogalmairól és kapcsolatairól. A számos formális adatmodellező jelölési rendszer egyikét követik. Ezek adatjellemzőket, például adattípusokat és azok megfelelő hosszát jelölik, valamint az entitások közötti kapcsolatokat mutatják. A logikai adatmodellek nem adnak meg semmilyen műszaki rendszerkövetelményt. Ezt a szakaszt gyakran kihagyják az agilis vagy DevOps gyakorlatokban. A logikai adatmodellek hasznosak lehetnek a rendkívül eljárási végrehajtási környezetekben, vagy olyan projektek esetében, amelyek természetüknél fogva adatorientáltak, mint például az adattárház kialakítása vagy a jelentési rendszer fejlesztése.
    Diagram of a Logical Data Model
  • fizikai adatmodellek. Adnak egy sémát, hogy az adatokat fizikailag tárolja az adatbázisban. Mint ilyen, ezek a legkevésbé elvontak. Kínálnak egy véglegesített design, hogy lehet végrehajtani, mint egy relációs adatbázis, beleértve asszociatív táblázatok, amelyek bemutatják a kapcsolatok entitások között, valamint az elsődleges kulcsok és idegen kulcsok, hogy fogják használni, hogy fenntartsák ezeket a kapcsolatokat. A fizikai adatmodellek tartalmazhatnak adatbázis-kezelő rendszert (DBMS)-specifikus tulajdonságokat, beleértve a teljesítmény hangolását is.
    fizikai adatmodell diagramja

adatmodellezési folyamat

mint tudományág, az adatmodellezés felkéri az érdekelteket, hogy értékeljék az adatfeldolgozást és tárolást alapos részletességgel. Adatok modellezési technikák különböző egyezmények, amelyek előírják, amely szimbólumokat jelentik az adatokat, hogy a modellek megállapított, valamint, hogy üzleti követelmények szállítani. Minden megközelítés formális munkafolyamatokat biztosít, amelyek iteratív módon végrehajtandó feladatok sorozatát tartalmazzák. Ezek a munkafolyamatok általában így néznek ki:

  1. azonosítsa az entitásokat. Az adatmodellezés folyamata a modellezendő adatkészletben ábrázolt dolgok, események vagy fogalmak azonosításával kezdődik. Minden entitásnak egységesnek és logikusan diszkrétnek kell lennie minden mástól.
  2. azonosítsa az egyes entitások kulcstulajdonságait. Minden entitás típusát meg lehet különböztetni az összes többitől, mert egy vagy több egyedi tulajdonsággal rendelkezik, úgynevezett attribútumokkal. Például egy “ügyfél” nevű entitás rendelkezhet olyan attribútumokkal, mint a keresztnév, vezetéknév, telefonszám és üdvözlet, míg egy “cím” nevű entitás tartalmazhat utcanevet és számot, várost, államot, országot és irányítószámokat.
  3. azonosítsa az entitások közötti kapcsolatokat. Az adatmodell legkorábbi tervezete meghatározza az egyes entitások másokkal való kapcsolatainak jellegét. A fenti példában minden ügyfél “lakik” egy címen. Ha ezt a modellt kiterjesztenék egy “megrendelések” nevű entitásra, minden megrendelést egy címre szállítanának, és számláznának. Ezeket a kapcsolatokat általában egységes modellezési nyelven (UML) dokumentálják.
  4. Térkép attribútumok entitások teljesen. Ez biztosítja, hogy a modell tükrözze, hogy az üzleti fogja használni az adatokat. Számos formális adatmodellezési minta széles körben elterjedt. Az objektumorientált fejlesztők gyakran alkalmaznak elemzési mintákat vagy tervezési mintákat, míg más üzleti területek érdekelt felei más mintákhoz fordulhatnak.
  5. szükség szerint hozzárendelje a kulcsokat, és döntsön a normalizáció mértékéről, amely kiegyensúlyozza a redundancia csökkentésének szükségességét a teljesítménykövetelményekkel. A normalizálás olyan adatmodellek (és az általuk képviselt adatbázisok) szervezésének technikája, amelyben numerikus azonosítókat, úgynevezett kulcsokat rendelnek az adatcsoportokhoz, hogy az adatok megismétlése nélkül ábrázolják a köztük lévő kapcsolatokat. Például, ha az ügyfelek mindegyike rendelkezik egy kulccsal, akkor ez a kulcs összekapcsolható mind a címükhöz, mind a rendelési előzményeikhez anélkül, hogy ezt az információt meg kellene ismételnie az ügyfélnevek táblázatában. A normalizálás általában csökkenti az adatbázis által igényelt tárterület mennyiségét, de költségesen lekérdezheti a teljesítményt.
  6. Az adatmodell véglegesítése és érvényesítése. Az adatmodellezés egy iteratív folyamat, amelyet az üzleti igények változásával meg kell ismételni és finomítani kell.

Típusú adat modellezés

Adatok modell fejlődött mellett adatbázis-kezelő rendszerek, a modell típusok növekvő komplexitás, mint a vállalkozások adatok tárolási igények nőttek. Íme néhány modelltípus:

  • A hierarchikus adatmodellek egy-sok kapcsolatot képviselnek treelike formátumban. Az ilyen típusú modellben minden rekordnak egyetlen gyökere vagy szülője van, amely egy vagy több gyermektáblára térképez. Ezt a modellt az 1966-ban bevezetett IBM Information Management System (IMS) rendszerben hajtották végre, amely gyorsan széles körben elterjedt, különösen a banki szolgáltatások területén. Bár ez a megközelítés kevésbé hatékony, mint a közelmúltban kifejlesztett adatbázis modellek, még mindig használják Extensible Markup Language (XML) rendszerek és földrajzi információs rendszerek (GISs).
  • relációs adatmodellek eredetileg javasolt IBM kutató E. F. Codd 1970-ben. Ezek ma is megvalósításra kerülnek a vállalati számítástechnikában általánosan használt számos különböző relációs adatbázisban. A relációs adatmodellezés nem igényli a felhasznált Adattárolás fizikai tulajdonságainak részletes megértését. Ebben az adatszegmensek kifejezetten összekapcsolódnak táblázatok használatával, csökkentve az adatbázis összetettségét.

relációs adatbázisok gyakran alkalmaznak strukturált lekérdezési nyelvet (SQL) az adatkezeléshez. Ezek az adatbázisok jól működnek az adatok integritásának megőrzésében és a redundancia minimalizálásában. Gyakran használják a point-of-sale rendszerekben, valamint más típusú tranzakció feldolgozáshoz.

  • Entity-relationship (ER) adatmodellek formális diagramokat használnak az adatbázis entitásai közötti kapcsolatok ábrázolására. Számos ER modellező eszközt használnak az adatépítészek olyan vizuális térképek készítéséhez, amelyek adatbázis-tervezési célokat közvetítenek.
  • az objektumorientált adatmodellek objektumorientált programozás révén vonzóvá váltak, és az 1990-es évek közepén vált népszerűvé. az érintett “objektumok” a valós entitások absztrakciói. Az objektumok osztályhierarchiákba vannak csoportosítva, és társított funkciókkal rendelkeznek. Az objektumorientált adatbázisok táblázatokat is tartalmazhatnak, de komplexebb adatkapcsolatokat is támogathatnak. Ezt a megközelítést alkalmazzák multimédiás és hipertext adatbázisokban, valamint más felhasználási esetekben.
  • a dimenziós adatmodelleket Ralph Kimball fejlesztette ki, és arra tervezték őket, hogy optimalizálják az adatkeresési sebességet analitikai célokra egy adattárházban. Míg a relációs és ER modellek a hatékony tárolást hangsúlyozzák, a dimenziós modellek növelik a redundanciát annak érdekében, hogy megkönnyítsék a jelentési és visszakeresési információk megtalálását. Ezt a modellezést általában az OLAP rendszerekben használják.

Két népszerű dimenziós adatok modell a sztár séma, amelyben az adatok szervezett tények (mérhető elemek), valamint méretek (referencia információ), ahol minden tény körül a kapcsolódó méretek egy csillag, mint a minta. A másik a hópehely séma, amely hasonlít a csillagsémára, de további kapcsolódó dimenziós rétegeket is tartalmaz, így az elágazási minta összetettebb.

Előnyei adatok modellezés

Adatok modell megkönnyíti a fejlesztők, adatok építészek, üzleti elemzők, valamint az egyéb érdekeltek megtekintéséhez megérteni a kapcsolatok között az adatokat egy adatbázisban vagy adattárház. Ezen felül:

  • csökkentheti a szoftver-és adatbázisfejlesztési hibákat.
  • a dokumentáció és a rendszertervezés következetességének növelése a vállalat egész területén.
  • Az alkalmazás és az adatbázis teljesítményének javítása.
  • megkönnyíti az adatok feltérképezését az egész szervezetben.
  • Javítani kell a fejlesztők és az üzleti intelligencia csapatok közötti kommunikációt.
  • megkönnyíti és felgyorsítja az adatbázis-tervezés folyamatát fogalmi, logikai és fizikai szinten.

adatmodellező eszközök

számos kereskedelmi és nyílt forráskódú számítógépes szoftverfejlesztő (CASE) megoldást széles körben használnak ma, beleértve több adatmodellező, diagramming és vizualizációs eszközt. Íme néhány példa:

  • az erwin Data Modeler egy adatmodellező eszköz, amely az információmodellezés integrációs definícióján (IDEF1X) alapul adatmodellező nyelv, amely most más jelölési módszereket támogat, beleértve a dimenziós megközelítést is.
  • Az Enterprise Architect egy vizuális modellező és tervező eszköz, amely támogatja a vállalati információs rendszerek és architektúrák, valamint a szoftver alkalmazások és adatbázisok modellezését. Objektumorientált nyelveken és szabványokon alapul.
  • az ER / Studio adatbázis-tervező szoftver, amely kompatibilis a mai legnépszerűbb adatbázis-kezelő rendszerekkel. Támogatja mind a relációs, mind a dimenziós adatmodellezést.
  • az ingyenes adatmodellező eszközök közé tartoznak a nyílt forráskódú megoldások, például az Open ModelSphere.

adatmodellezés és IBM Cloud

az IBM kutatói azon úttörők közé tartoztak, akik létrehozták az első hierarchikus és relációs adatmodelleket, valamint megtervezték azokat az adatbázisokat is, ahol ezeket a modelleket eredetileg megvalósították.

ma az IBM Cloud egy teljes stack platformot biztosít, amely támogatja az SQL és NoSQL adatbázisok gazdag portfólióját, valamint olyan fejlesztői eszközöket, amelyek szükségesek a bennük lévő adatforrások hatékony kezeléséhez. Az IBM Cloud olyan nyílt forráskódú eszközöket is támogat, amelyek segítenek a fejlesztőknek objektum -, fájl-és adattárolást kezelni a teljesítmény és a megbízhatóság optimalizálása érdekében.

szeretne többet megtudni az adatok modellezéséről az IBM Cloud-on? Iratkozzon fel egy IBMid-re, és hozza létre ma ingyenes IBM Cloud-fiókját.