Articles

Datamodellering

Oppdag hvordan datamodellering bruker abstraksjon for å representere og bedre forstå innholdet av dataflyt i et bedriftsinformasjonssystem

Hva er datamodellering?

datamodellering Er prosessen med å skape en visuell representasjon av enten et helt informasjonssystem eller deler av Det for å kommunisere forbindelser mellom datapunkter og strukturer. Målet er å illustrere hvilke typer data som brukes og lagres i systemet, forholdet mellom disse datatypene, hvordan dataene kan grupperes og organiseres og dets formater og attributter.

datamodeller er bygget rundt forretningsbehov. Regler og krav defineres på forhånd gjennom tilbakemeldinger fra forretningsinteressenter, slik at de kan innlemmes i utformingen av et nytt system eller tilpasses i iterasjonen av en eksisterende.

Data kan modelleres på ulike nivåer av abstraksjon. Prosessen starter med å samle inn informasjon om forretningsbehov fra interessenter og sluttbrukere. Disse forretningsreglene blir deretter oversatt til datastrukturer for å formulere en konkret databasedesign. En datamodell kan sammenlignes med et veikart, en arkitekt blåkopi eller noen formell diagram som muliggjør en dypere forståelse av hva som blir utformet.

datamodellering benytter standardiserte skjemaer og formelle teknikker. Dette gir en felles, konsekvent og forutsigbar måte å definere og administrere dataressurser på tvers av en organisasjon, eller til og med utover.Ideelt sett er datamodeller levende dokumenter som utvikler seg sammen med endrede forretningsbehov. De spiller en viktig rolle i å støtte forretningsprosesser og planlegge IT-arkitektur og strategi. Datamodeller kan deles med leverandører, partnere og/eller bransjekolleger.

Typer datamodeller

som enhver designprosess begynner database-og informasjonssystemdesign på et høyt abstraksjonsnivå og blir stadig mer konkret og spesifikk. Datamodeller kan generelt deles inn i tre kategorier, som varierer i henhold til graden av abstraksjon. Prosessen vil starte med en konseptuell modell, gå videre til en logisk modell og konkludere med en fysisk modell. Hver type datamodell er omtalt nærmere nedenfor:

  • Konseptuelle datamodeller. De er også referert til som domenemodeller og tilbyr et stort bilde av hva systemet vil inneholde, hvordan det vil bli organisert, og hvilke forretningsregler som er involvert. Konseptuelle modeller opprettes vanligvis som en del av prosessen med å samle innledende prosjektkrav. Vanligvis inkluderer de enhetsklasser (definere hvilke typer ting som er viktige for virksomheten å representere i datamodellen), deres egenskaper og begrensninger, forholdet mellom dem og relevante sikkerhets-og dataintegritetskrav. Enhver notasjon er vanligvis enkel.
    Diagram av En Konseptuell Datamodell
  • Logiske datamodeller. De er mindre abstrakte og gir større detalj om begreper og relasjoner i domenet under vurdering. En av flere formelle datamodellerings notasjonssystemer følges. Disse angir dataattributter, for eksempel datatyper og tilhørende lengder, og viser relasjonene mellom enheter. Logiske datamodeller angir ikke tekniske systemkrav. Dette stadiet er ofte utelatt i agile eller DevOps praksis. Logiske datamodeller kan være nyttige i svært prosessuelle implementeringsmiljøer, eller for prosjekter som er dataorienterte av natur, for eksempel datavarehusdesign eller rapporteringssystemutvikling.
    Diagram av En Logisk Datamodell
  • Fysiske datamodeller. De gir et skjema for hvordan dataene blir fysisk lagret i en database. Som sådan er de minst abstrakte av alle. De tilbyr en ferdig design som kan implementeres som en relasjonsdatabase, inkludert assosiative tabeller som illustrerer forholdet mellom enheter, samt primærnøkler og utenlandske nøkler som skal brukes til å opprettholde disse relasjonene. Fysiske datamodeller kan inkludere databasebehandlingssystem (dbms)-spesifikke egenskaper, inkludert ytelsesjustering.
    Diagram Av En Fysisk Datamodell

datamodelleringsprosess

som en disiplin inviterer datamodellering interessenter til å evaluere databehandling og lagring i omhyggelig detalj. Datamodelleringsteknikker har forskjellige konvensjoner som dikterer hvilke symboler som brukes til å representere dataene, hvordan modeller legges ut og hvordan forretningsbehov formidles. Alle tilnærminger gir formaliserte arbeidsflyter som inkluderer en rekke oppgaver som skal utføres på en iterativ måte. Disse arbeidsflytene ser vanligvis slik ut:

  1. Identifiser enhetene. Prosessen med datamodellering begynner med identifisering av ting, hendelser eller konsepter som er representert i datasettet som skal modelleres. Hver enhet bør være sammenhengende og logisk diskret fra alle andre.
  2. Identifiser nøkkelegenskapene til hver enhet. Hver enhetstype kan differensieres fra alle andre fordi den har en eller flere unike egenskaper, kalt attributter. For eksempel kan en enhet kalt «kunde» ha slike attributter som fornavn, etternavn, telefonnummer og hilsen, mens en enhet kalt «adresse» kan inneholde et gatenavn og nummer, en by, stat, land og postnummer.
  3. Identifiser relasjoner mellom enheter. Det tidligste utkastet til en datamodell vil spesifisere arten av relasjonene hver enhet har med de andre. I eksemplet ovenfor bor hver kunde » på » en adresse. Hvis denne modellen ble utvidet til å omfatte en enhet kalt «ordrer», ville hver ordre bli sendt til og fakturert til en adresse også. Disse relasjonene er vanligvis dokumentert via unified modeling language (UML).
  4. Kart attributter til enheter helt. Dette vil sikre at modellen gjenspeiler hvordan virksomheten vil bruke dataene. Flere formelle datamodelleringsmønstre er i utbredt bruk. Objektorienterte utviklere bruker ofte analysemønstre eller designmønstre, mens interessenter fra andre forretningsdomener kan vende seg til andre mønstre.
  5. Tilordne nøkler etter behov, og bestem deg for en grad av normalisering som balanserer behovet for å redusere redundans med ytelseskrav. Normalisering er en teknikk for å organisere datamodeller (og databasene de representerer) der numeriske identifikatorer, kalt nøkler, tilordnes grupper av data for å representere relasjoner mellom dem uten å gjenta dataene. For eksempel, hvis kundene er hver tildelt en nøkkel, kan nøkkelen knyttes til både deres adresse og deres ordrehistorikk uten å måtte gjenta denne informasjonen i tabellen over kundenavn. Normalisering har en tendens til å redusere mengden lagringsplass en database vil kreve, men det kan koste å spørre ytelse.
  6. Sluttføre og validere datamodellen. Datamodellering er en iterativ prosess som bør gjentas og raffineres etter hvert som forretningsbehovene endres.

Typer datamodellering

datamodellering har utviklet seg sammen med databasebehandlingssystemer, med modelltyper som øker i kompleksitet etter hvert som bedriftens datalagrings behov har vokst. Her er flere modelltyper:

  • Hierarkiske datamodeller representerer en-til-mange-relasjoner i et treelike-format. I denne typen modell har hver post en enkelt rot eller overordnet som tilordner til en eller flere underordnede tabeller. Denne modellen ble implementert I IBM Information Management System (IMS), som ble introdusert i 1966 og raskt funnet utbredt bruk, spesielt i bank. Selv om denne tilnærmingen er mindre effektiv enn mer nylig utviklede databasemodeller, brukes den fortsatt I Extensible Markup Language (XML) – systemer og geografiske informasjonssystemer (giss).Relasjonsdatamodeller ble opprinnelig foreslått AV IBM-forsker E. F. Codd i 1970. De er fortsatt implementert i dag i de mange forskjellige relasjonsdatabaser som vanligvis brukes i enterprise computing. Relasjonsdatamodellering krever ikke en detaljert forståelse av de fysiske egenskapene til datalagringen som brukes. I det er datasegmenter eksplisitt forbundet gjennom bruk av tabeller, noe som reduserer databasekompleksiteten.

Relasjonsdatabaser bruker ofte structured query language (SQL) for datahåndtering. Disse databasene fungerer godt for å opprettholde dataintegritet og minimere redundans. De er ofte brukt i point-of-salg systemer, så vel som for andre typer transaksjonsbehandling.

  • Entity-relationship (Er) datamodeller bruker formelle diagrammer til å representere relasjonene mellom enheter i en database. Flere ER-modelleringsverktøy brukes av dataarkitekter til å lage visuelle kart som formidler databaseutformingsmål.Objektorienterte datamodeller fikk trekkraft som objektorientert programmering, og det ble populært på midten av 1990-tallet. «objektene» involvert er abstraksjoner av virkelige enheter. Objekter grupperes i klassehierarkier og har tilknyttede funksjoner. Objektorienterte databaser kan inkludere tabeller, men kan også støtte mer komplekse datarelasjoner. Denne tilnærmingen er ansatt i multimedia og hypertekst databaser samt andre brukstilfeller.Dimensjonale datamodeller ble utviklet av Ralph Kimball, og de ble designet for å optimalisere datahentingshastigheter for analytiske formål i et datalager. Mens relasjons-og ER-modeller legger vekt på effektiv lagring, øker dimensjonsmodeller redundansen for å gjøre det enklere å finne informasjon for rapportering og gjenfinning. Denne modelleringen brukes vanligvis på TVERS AV OLAP-systemer.To populære dimensjonsdatamodeller er stjerneskjemaet, der data er organisert i fakta (målbare elementer) og dimensjoner( referanseinformasjon), hvor hvert faktum er omgitt av tilhørende dimensjoner i et stjernelignende mønster. Den andre er snowflake-skjemaet, som ligner stjerneskjemaet, men inneholder flere lag med tilhørende dimensjoner, noe som gjør forgreningsmønsteret mer komplekst.

    Fordeler med datamodellering

    datamodellering gjør det enklere for utviklere, dataarkitekter, forretningsanalytikere og andre interessenter å se og forstå relasjoner mellom dataene i en database eller datalager. I tillegg Kan det:

    • Redusere feil i programvare og database utvikling.
    • Øk konsistens i dokumentasjon og systemdesign på tvers av bedriften.
    • Forbedre program-og databaseytelsen.
    • Lette datakartlegging i hele organisasjonen.
    • Forbedre kommunikasjonen mellom utviklere og business intelligence-team.Lette og fremskynde prosessen med databasedesign på konseptuelle, logiske og fysiske nivåer.

    datamodelleringsverktøy

    Tallrike kommersielle og åpen kildekode computer-aided software engineering (CASE) løsninger er mye brukt i dag, inkludert flere datamodellering, diagram og visualiseringsverktøy. Her er flere eksempler:erwin Data Modeler er et datamodelleringsverktøy basert PÅ INTEGRATION DEFinition for information modeling (IDEF1X) datamodelleringsspråk som nå støtter andre notasjonsmetoder, inkludert en dimensjonal tilnærming.Enterprise Architect Er en visuell modellering og design verktøy som støtter modellering av bedriftens informasjonssystemer og arkitekturer samt programmer og databaser. Den er basert på objektorienterte språk og standarder.ER / Studio er database design programvare som er kompatibel med flere av dagens mest populære database styringssystemer. Den støtter både relasjonell og dimensjonal datamodellering.

  • Gratis datamodelleringsverktøy inkluderer åpen kildekode-løsninger som Open ModelSphere.

datamodellering og IBM Cloud

FORSKERE ved IBM var blant pionerene som skapte de første hierarkiske og relasjonelle datamodellene og designet også databasene der disse modellene ble implementert.I DAG tilbyr IBM Cloud en full stack-plattform som støtter en rik portefølje AV SQL-og NoSQL-databaser, sammen med utviklerverktøy som trengs for å administrere dataressurser i dem effektivt. IBM Cloud støtter også åpen kildekode-verktøy som hjelper utviklere med å administrere objekter, filer og blokkere datalagring for å optimalisere ytelsen og påliteligheten.

Vil du lære mer om modellering av DATA PÅ IBM Cloud? Registrer Deg For En IBMid og opprett DIN GRATIS IBM Cloud-konto i dag.