Articles

Data Modeling

Discover how data modeling uses abstraction to represent and better understand the nature of data flow within an enterprise information system

What is data modeling?

modelagem de dados é o processo de criação de uma representação visual de um sistema de informação completo ou partes dele para comunicar conexões entre pontos de dados e estruturas. O objetivo é ilustrar os tipos de dados utilizados e armazenados dentro do sistema, as relações entre esses tipos de dados, as formas como os dados podem ser agrupados e organizados e seus formatos e atributos.os modelos de dados são construídos em torno das necessidades do negócio. As regras e requisitos são definidos antecipadamente através do feedback das partes interessadas do negócio para que possam ser incorporados na concepção de um novo sistema ou adaptados na iteração de um sistema existente.

os dados podem ser modelados em vários níveis de abstração. O processo começa pela coleta de informações sobre os requisitos de negócios dos stakeholders e usuários finais. Estas regras de negócio são então traduzidas em estruturas de dados para formular um projeto de banco de dados Concreto. Um modelo de dados pode ser comparado a um roteiro, um projeto de arquiteto ou qualquer diagrama formal que facilita uma compreensão mais profunda do que está sendo projetado.

a modelagem de dados emprega esquemas padronizados e técnicas formais. Isso fornece uma forma comum, consistente e previsível de definir e gerenciar os recursos de dados através de uma organização, ou mesmo além.idealmente, os modelos de dados são documentos vivos que evoluem juntamente com a mudança das necessidades do negócio. Desempenham um papel importante no apoio aos processos empresariais e no planeamento da arquitectura e da estratégia de TI. Modelos de dados podem ser compartilhados com fornecedores, parceiros e/ou parceiros da indústria.tipos de modelos de dados como qualquer processo de projeto, banco de dados e sistema de informação começa em um alto nível de abstração e se torna cada vez mais concreto e específico. Modelos de dados geralmente podem ser divididos em três categorias, que variam de acordo com o seu grau de abstração. O processo vai começar com um modelo conceitual, avançar para um modelo lógico e concluir com um modelo físico. Cada tipo de modelo de dados é discutido em mais detalhes abaixo:

  • modelos conceituais de dados. Eles também são referidos como modelos de domínio e oferecem uma visão geral do que o sistema irá conter, como ele será organizado, e que regras de Negócio estão envolvidas. Os modelos conceptuais são normalmente criados como parte do processo de recolha dos requisitos iniciais do projecto. Normalmente, incluem classes de entidades (definindo os tipos de coisas que são importantes para a empresa representar no modelo de dados), as suas características e restrições, as relações entre elas e os requisitos relevantes de segurança e integridade dos dados. Qualquer notação é tipicamente simples.
    Diagram of a Conceptual Data Model
  • modelos de dados lógicos. Eles são menos abstratos e fornecem mais detalhes sobre os conceitos e relacionamentos no domínio em consideração. Um dos vários sistemas formais de modelagem de dados é seguido. Estes indicam atributos de dados, tais como tipos de dados e seus comprimentos correspondentes, e mostram as relações entre as entidades. Modelos de dados lógicos não especificam quaisquer requisitos técnicos do sistema. Esta etapa é frequentemente omitida em práticas ágeis ou DevOps. Modelos de dados lógicos podem ser úteis em ambientes de implementação altamente processuais, ou para projetos que são orientados para dados por natureza, tais como projeto de armazenamento de dados ou desenvolvimento de sistemas de relatórios.
    Diagrama de um Modelo Lógico dos Dados
  • Física de modelos de dados. Eles fornecem um esquema para como os dados serão fisicamente armazenados dentro de uma base de dados. Como tal, são o menos abstracto de todos. Eles oferecem um design finalizado que pode ser implementado como um banco de dados relacional, incluindo tabelas associativas que ilustram as relações entre entidades, bem como as chaves primárias e chaves estrangeiras que serão usadas para manter essas relações. Modelos de dados físicos podem incluir propriedades específicas do sistema de gerenciamento de banco de dados (DBMS), incluindo ajustes de desempenho.
    Diagrama de Física do Modelo de Dados

processo de modelagem de Dados

Como uma disciplina de modelagem de dados convida as partes interessadas para avaliar o processamento de dados e armazenamento em minucioso detalhe. Técnicas de modelagem de dados têm diferentes convenções que ditam quais símbolos são usados para representar os dados, como modelos são estabelecidos, e como os requisitos de negócios são transmitidos. Todas as abordagens fornecem fluxos de trabalho formalizados que incluem uma sequência de tarefas a serem executadas de forma iterativa. Esses fluxos de trabalho são geralmente assim:

  1. Identificar as entidades. O processo de modelagem de dados começa com a identificação das coisas, eventos ou conceitos que são representados no conjunto de dados que deve ser modelado. Cada entidade deve ser coesa e logicamente discreta de todas as outras.identificar as propriedades chave de cada entidade. Cada tipo de entidade pode ser diferenciado de todos os outros porque tem uma ou mais propriedades únicas, chamadas atributos. Por exemplo, uma entidade chamada “cliente” pode possuir atributos como um primeiro nome, sobrenome, número de telefone e saudação, enquanto uma entidade chamada “endereço” pode incluir um nome de rua e número, uma cidade, estado, país e Código Postal.identificar as relações entre as entidades. O rascunho mais antigo de um modelo de dados especificará a natureza das relações que cada entidade tem com os outros. No exemplo acima, cada cliente “vive” em um endereço. Se esse modelo fosse expandido para incluir uma entidade chamada “ordens”, cada ordem seria enviada para e faturada para um endereço também. Estas relações são geralmente documentadas através da unified modeling language (UML).
  2. Map attributes to entities completely. Isto assegurará que o modelo reflicta a forma como a empresa utilizará os dados. Vários padrões formais de modelagem de dados estão em uso generalizado. Desenvolvedores orientados a objetos muitas vezes aplicam padrões de análise ou padrões de design, enquanto stakeholders de outros domínios de negócios podem se voltar para outros padrões.atribuir chaves conforme necessário, e decidir sobre um grau de normalização que equilibre a necessidade de reduzir a redundância com os requisitos de desempenho. Normalização é uma técnica para organizar modelos de dados (e os bancos de dados que eles representam) em que identificadores numéricos, chamados chaves, são atribuídos a grupos de dados para representar relações entre eles sem repetir os dados. Por exemplo, se a cada cliente for atribuída uma chave, essa chave pode ser ligada ao seu endereço e ao seu histórico de encomendas sem ter de repetir esta informação na tabela de nomes de clientes. A normalização tende a reduzir a quantidade de espaço de armazenamento que um banco de dados necessitará, mas pode a custo de desempenho de consulta.
  3. Finalize e valide o modelo de dados. Modelagem de dados é um processo iterativo que deve ser repetido e refinado à medida que as necessidades do negócio mudam.

tipos de modelagem de dados

modelagem de dados evoluiu ao lado de sistemas de gerenciamento de banco de dados, com tipos de modelos aumentando em complexidade à medida que as necessidades de armazenamento de dados das empresas têm crescido. Aqui estão vários tipos de modelos:

  • os modelos hierárquicos de dados representam relações de um para muitos num formato semelhante ao da árvore. Neste tipo de modelo, cada registro tem uma única raiz ou pai que mapeia para uma ou mais tabelas-filhos. Este modelo foi implementado no IBM Information Management System (IMS), que foi introduzido em 1966 e rapidamente encontrou uso generalizado, especialmente no setor bancário. Embora esta abordagem seja menos eficiente do que modelos de banco de dados mais recentemente desenvolvidos, ainda é usado em sistemas XML (Extensible Markup Language) e sistemas de Informação Geográfica (giss).modelos de dados relacionais foram inicialmente propostos pelo pesquisador da IBM E. F. Codd em 1970. Eles ainda são implementados hoje em dia nas muitas bases de dados relacionais comumente usadas na computação corporativa. Modelagem de dados relacionais não requer uma compreensão detalhada das propriedades físicas do armazenamento de dados sendo usado. Nele, os segmentos de dados são explicitamente Unidos através do uso de tabelas, reduzindo a complexidade do banco de dados.

bases de dados relacionais frequentemente empregam linguagem de consulta estruturada (SQL) para a gestão de dados. Estas bases de dados funcionam bem para manter a integridade dos dados e minimizar a redundância. Eles são frequentemente usados em sistemas de ponto de venda, bem como para outros tipos de processamento de transações.

  • Entity-relationship (ER) modelos de dados usam diagramas formais para representar as relações entre entidades em uma base de dados. Várias ferramentas de modelagem ER são usadas por arquitetos de dados para criar mapas visuais que transmitem objetivos de projeto de banco de dados.os modelos de dados orientados a objetos ganharam força como programação orientada a objetos e tornou-se popular em meados da década de 1990. os “objetos” envolvidos são abstrações de entidades do mundo real. Objetos são agrupados em hierarquias de classe, e têm características associadas. Bases de dados orientadas a objetos podem incorporar tabelas, mas também podem suportar relações de dados mais complexas. Esta abordagem é utilizada em bases de dados multimédia e hipertexto, bem como noutros casos de Utilização.modelos de dados dimensionais foram desenvolvidos por Ralph Kimball, e eles foram projetados para otimizar as velocidades de recuperação de dados para fins analíticos em um armazém de dados. Enquanto os modelos relacionais e ER enfatizam o armazenamento eficiente, os modelos dimensionais aumentam a redundância, a fim de facilitar a localização da informação para a comunicação e recuperação. Esta modelagem é tipicamente usada em sistemas OLAP.

dois modelos de dados dimensionais populares são o esquema estelar, no qual os dados são organizados em fatos (itens mensuráveis) e dimensões (informação de referência), onde cada fato é cercado por suas dimensões associadas em um padrão semelhante à estrela. O outro é o esquema do floco de neve, que se assemelha ao esquema da estrela, mas inclui camadas adicionais de dimensões associadas, tornando o padrão de ramificação mais complexo.

benefícios da modelagem de dados

a modelagem de dados torna mais fácil para desenvolvedores, arquitetos de dados, analistas de negócios e outros stakeholders ver e entender as relações entre os dados em um banco de dados ou data warehouse. Além disso, ele pode:

  • reduzir erros no desenvolvimento de software e banco de dados.aumentar a consistência na documentação e na concepção do sistema em toda a empresa.melhorar o desempenho da aplicação e da base de dados.facilitar o mapeamento de dados em toda a organização.melhorar a comunicação entre desenvolvedores e equipes de inteligência de negócios.
  • Ease and speed the process of database design at the conceptual, logical and physical levels.

Ferramentas de modelagem de dados

inúmeras soluções de engenharia de software auxiliada por computador de código aberto e comercial (CASE) são amplamente utilizadas hoje em dia, incluindo múltiplas ferramentas de modelagem de dados, diagramação e visualização. Aqui estão vários exemplos:

  • erwin Data Modeler é uma ferramenta de modelagem de dados baseada na definição de integração para modelagem de dados (IDEF1X) linguagem de modelagem de dados que agora suporta outras metodologias de notação, incluindo uma abordagem dimensional.o “Enterprise Architect” é uma ferramenta de modelagem visual e design que suporta a modelagem de sistemas de informação e arquiteturas empresariais, bem como aplicações de software e bancos de dados. É baseado em linguagens e padrões orientados a objetos.
  • Er / Studio é um software de projeto de banco de dados que é compatível com vários dos sistemas de gerenciamento de banco de dados mais populares de hoje. Ele suporta modelagem de dados relacionais e dimensionais.
  • ferramentas de modelagem livre de dados incluem soluções de código aberto, como a Modelosfera aberta.

modelagem de Dados e IBM Cloud

os Pesquisadores da IBM, estavam entre os pioneiros que criaram o primeiro hierárquicos e relacionais, modelos de dados e, também, o bancos de dados, onde estes modelos foram inicialmente implementadas.

hoje, IBM Cloud fornece uma plataforma de pilha completa que suporta um portfólio rico de bases de dados SQL e NoSQL, juntamente com ferramentas de desenvolvimento necessárias para gerenciar os recursos de dados dentro deles de forma eficiente. A IBM Cloud também suporta ferramentas de código aberto que ajudam os desenvolvedores a gerenciar objetos, arquivos e armazenamento de dados para otimizar o desempenho e a confiabilidade.

deseja saber mais sobre Modelagem de dados na IBM Cloud? Inscreva-se num IBMid e crie a sua conta na nuvem IBM grátis hoje.