Definition der Datenmodellierung
Datenmodellierung (engl. Data Modeling) ist im Allgemeinen ein Prozess zur Definition und Analyse der Datenanforderungen, die zur Unterstützung von Geschäftsprozessen in den entsprechenden Informationssystemen von Organisationen benötigt werden. Bei der Datenmodellierung werden nicht nur die Datenelemente, sondern auch deren Strukturen und Beziehungen definiert.
Datenmodellierung in der Datenverwaltung ist der Prozess in objektorientierten Sprachen zur Erstellung eines Datenmodells für die in der Datenbank zu speichernden Daten. Dieses Datenmodell ist eine konzeptuelle Darstellung der Datenobjekte, der Beziehungen zwischen den Datenobjekten und der Regeln.
Die Datenmodellierung ist ein Mittel zur visuellen Darstellung von Daten und zur Sicherstellung der Einhaltung von Geschäftsregeln, datenbezogenen gesetzlichen Anforderungen und behördlichen Richtlinien.
Wie funktioniert die Datenmodellierung?
Vereinfacht ausgedrückt umfasst die Datenmodellierung die folgenden Schritte:
- Daten werden konkreten Geschäftsobjekten, den so genannten Entitäten, z.B. Kunden zugeordnet.
- Zu den Entitäten werden bestimmte Attribute – also Merkmale und Eigenschaften – definiert, z.B. Name, Adresse, E-Mail des Kunden.
- Verschiedene Entitäten werden zueinander in Beziehung gesetzt, z.B. ein Kunde kann Aufträge erteilen.
Das Hauptziel der Datenmodellierung besteht also darin, die Entitäten, ihre Attribute und ihre Beziehungen zu identifizieren. Alle Datenflüsse und -strukturen werden entworfen und in einem Datenmodell in Form eines Flussdiagramms zur Erstellung von Datenbanken und Informationssystemen visuell dargestellt.
In einem Datenmodell werden Datenformate, Beziehungen und Regeln klar definiert, damit die korrekte Speicherung, Verwaltung und Abfrage aller Daten gewährleistet ist. Durch Datenmodellierung können Unternehmen ihre Datenflüsse besser strukturieren und organisieren. Dies verbessert die Effizienz des Datenmanagements, erleichtert Entscheidungsprozesse und unterstützt die Anpassungsfähigkeit an sich ändernde Geschäftsanforderungen.
Arten der Datenmodellierung
Die Datenmodellierung ist im Wesentlichen ein Prozess von oben nach unten, der mit dem konzeptionellen Modell beginnt, das die Gesamtvision festlegt, dann zum logischen Modell übergeht und schließlich das detaillierte Design im physischen Modell enthält. Bei der Entwicklung des konzeptionellen Modells geht es in erster Linie darum, die Ideen in eine grafische Form zu bringen, die mit dem Flussdiagramm eines Entwicklers vergleichbar ist.
Die in der Datenbank gespeicherten Daten haben eine bestimmte logische Struktur, d.h. sie werden durch ein bestimmtes Datenrepräsentationsmodell (Datenmodell) beschrieben, das vom Datenbankmanagementsystem unterstützt wird. Der Modelltyp definiert die logische Struktur, d.h. wie die Daten logisch dargestellt werden, und damit auch, wie sie gespeichert, organisiert und abgerufen werden.
Die drei wichtigsten Arten sind das relationale Datenmodell, das dimensionale Datenmodell und das Entity-Relationship-Datenmodell. Es gibt noch einige andere, die nicht so häufig verwendet werden: das hierarchische Modell, das objektorientierte Modell, das Netzwerkmodell und das Modell mit mehreren Werten.
- Relationale Datenmodellierung ist eine Art und Weise, Daten zu betrachten, d.h. ein Rezept dafür, wie Daten dargestellt werden (mit Hilfe von Tabellen) und wie mit dieser Darstellung gearbeitet werden kann (mit Hilfe von Operatoren). Es bezieht sich auf drei Aspekte von Daten: Struktur (Objekte), Integrität und Datenverarbeitung (Operatoren).
- Dimensionale Datenmodellierung basiert auf dem Konzept von Fakten und Dimensionen. Fakten sind numerische Kennzahlen oder Indikatoren der Unternehmensleistung, Dimensionen sind beschreibende Attribute oder Kategorien, die den Kontext zu den Fakten liefern.
- Entity-Relationship-Datenmodellierung ist eine grafisch dargestellte Geschäftsdatenstruktur, in der Aktivitäten, Funktionen oder „Entitäten“ durch verschieden geformte Symbole und Zusammenhänge, Abhängigkeiten oder „Beziehungen“ durch Verbindungslinien dargestellt werden.
Die Wahl zwischen den verschiedenen Arten der Datenmodellierung ist nicht einfach, da sie von verschiedenen Faktoren wie Geschäftsanforderungen, Datenquellen, Datenvolumen, Datenqualität, Abfragemustern und Nutzererwartungen abhängt.