Was ist ein mehrdimensionales Schema?
Das mehrdimensionale Schema wurde speziell zur Modellierung von Data Warehouse-Systemen entwickelt. Die Schemata sind so konzipiert, dass sie die besonderen Anforderungen sehr großer Datenbanken erfüllen, die für analytische Zwecke (OLAP) entwickelt wurden.
Arten von Data Warehouse-Schemata:
Es folgen drei Haupttypen mehrdimensionaler Schemata, die jeweils ihre einzigartigen Vorteile haben.
- Sternschema
- Schneeflockenschema
- Galaxienschema
In diesem Tutorial erfahren Sie mehr über-
- Was ist ein Sternschema?
- Was ist ein Schneeflockenschema?
- Sternschema gegen Schneeflockenschema: Hauptunterschiede
- Was ist ein Galaxy-Schema?
- Was ist ein Sternhaufenschema?
Was ist ein Sternschema?
Star - Schema in Data Warehouse, in dem das Zentrum des Sterns kann man Faktentabelle und eine Reihe von zugehörigen Maßtabellen hat. Es ist als Sternschema bekannt, da seine Struktur einem Stern ähnelt. Das Star Schema-Datenmodell ist der einfachste Typ eines Data Warehouse-Schemas. Es wird auch als Star Join-Schema bezeichnet und ist für die Abfrage großer Datenmengen optimiert.
Im folgenden Beispiel für ein Sternschema befindet sich die Faktentabelle in der Mitte, die Schlüssel für jede Dimensionstabelle wie Dealer_ID, Modell-ID, Date_ID, Product_ID, Branch_ID und andere Attribute wie verkaufte Einheiten und Umsatz enthält.

Eigenschaften des Sternschemas:
- Jede Dimension in einem Sternschema wird mit der einzigen eindimensionalen Tabelle dargestellt.
- Die Dimensionstabelle sollte den Satz von Attributen enthalten.
- Die Dimensionstabelle wird mit einem Fremdschlüssel mit der Faktentabelle verknüpft
- Die Dimensionstabelle ist nicht miteinander verbunden
- Die Faktentabelle würde Schlüssel und Maß enthalten
- Das Star-Schema ist leicht zu verstehen und bietet eine optimale Festplattennutzung.
- Die Dimensionstabellen sind nicht normalisiert. In der obigen Abbildung verfügt Country_ID beispielsweise nicht über eine Country-Nachschlagetabelle, wie dies bei einem OLTP-Design der Fall wäre.
- Das Schema wird von BI Tools weitgehend unterstützt
Was ist ein Schneeflockenschema?
Das Schneeflockenschema im Data Warehouse ist eine logische Anordnung von Tabellen in einer mehrdimensionalen Datenbank, sodass das ER-Diagramm einer Schneeflockenform ähnelt. Ein Schneeflockenschema ist eine Erweiterung eines Sternschemas und fügt zusätzliche Dimensionen hinzu. Die Dimensionstabellen werden normalisiert, wodurch Daten in zusätzliche Tabellen aufgeteilt werden.
Im folgenden Beispiel für ein Schneeflockenschema wird das Land weiter in eine einzelne Tabelle normalisiert.

Eigenschaften des Schneeflockenschemas:
- Der Hauptvorteil des Schneeflockenschemas besteht darin, dass weniger Speicherplatz benötigt wird.
- Das Schema wird einfacher implementiert, um eine Dimension zu implementieren
- Aufgrund mehrerer Tabellen wird die Abfrageleistung reduziert
- Die größte Herausforderung bei der Verwendung des Schneeflockenschemas besteht darin, dass Sie aufgrund der mehr Nachschlagetabellen mehr Wartungsarbeiten durchführen müssen.
Sternschema gegen Schneeflockenschema: Hauptunterschiede
Das Folgende ist ein wesentlicher Unterschied zwischen dem Sternschema und dem Schneeflockenschema:
Sternschema | Schneeflockenschema |
---|---|
Hierarchien für die Dimensionen werden in der Dimensionstabelle gespeichert. | Hierarchien sind in separate Tabellen unterteilt. |
Es enthält eine Faktentabelle, die von Dimensionstabellen umgeben ist. | Eine Faktentabelle, die von einer Dimensionstabelle umgeben ist, die wiederum von einer Dimensionstabelle umgeben ist |
In einem Sternschema erstellt nur eine einzelne Verknüpfung die Beziehung zwischen der Faktentabelle und allen Dimensionstabellen. | Ein Schneeflockenschema erfordert viele Verknüpfungen, um die Daten abzurufen. |
Einfaches DB-Design. | Sehr komplexes DB-Design. |
Denormalisierte Datenstruktur und Abfrage werden ebenfalls schneller ausgeführt. | Normalisierte Datenstruktur. |
Hohe Datenredundanz | Datenredundanz auf sehr niedrigem Niveau |
Die Single Dimension-Tabelle enthält aggregierte Daten. | Aufteilung der Daten in verschiedene Dimensionstabellen. |
Die Würfelverarbeitung ist schneller. | Die Cube-Verarbeitung kann aufgrund der komplexen Verknüpfung langsam sein. |
Bietet leistungsstärkere Abfragen mithilfe der Star Join-Abfrageoptimierung. Tabellen können mit mehreren Dimensionen verbunden werden. | Das Schneeflockenschema wird durch eine zentralisierte Faktentabelle dargestellt, die wahrscheinlich nicht mit mehreren Dimensionen verbunden ist. |
Was ist ein Galaxy-Schema?
Ein Galaxy-Schema enthält zwei Faktentabellen, die Dimensionstabellen gemeinsam nutzen. Es wird auch als Faktenkonstellationsschema bezeichnet. Das Schema wird als Sammlung von Sternen angesehen, daher der Name Galaxy Schema.

Wie Sie im obigen Beispiel sehen können, gibt es zwei Faktentabellen
- Einnahmen
- Produkt.
In Galaxy-Schema-Freigaben werden Dimensionen als konforme Dimensionen bezeichnet.
Eigenschaften des Galaxienschemas:
- Die Dimensionen in diesem Schema werden basierend auf den verschiedenen Hierarchieebenen in separate Dimensionen unterteilt.
- Wenn die Geografie beispielsweise vier Hierarchieebenen wie Region, Land, Bundesland und Stadt aufweist, sollte das Galaxy-Schema vier Dimensionen haben.
- Darüber hinaus ist es möglich, diese Art von Schema zu erstellen, indem das Ein-Stern-Schema in mehrere Sternschemata aufgeteilt wird.
- Die Dimensionen in diesem Schema sind groß, das zum Erstellen auf der Grundlage der Hierarchieebenen erforderlich ist.
- Dieses Schema ist hilfreich, um Faktentabellen zum besseren Verständnis zusammenzufassen.
Was ist ein Sternhaufenschema?
Das Schneeflockenschema enthält vollständig erweiterte Hierarchien. Dies kann jedoch das Schema komplexer machen und erfordert zusätzliche Verknüpfungen. Andererseits enthält das Sternschema vollständig reduzierte Hierarchien, was zu Redundanz führen kann. Die beste Lösung könnte also ein Gleichgewicht zwischen diesen beiden Schemata sein, nämlich das Design des Sterncluster-Schemas.

Überlappende Dimensionen können als Gabeln in Hierarchien gefunden werden. Eine Abzweigung tritt auf, wenn eine Entität in zwei verschiedenen dimensionalen Hierarchien als übergeordnetes Element fungiert. Gabelentitäten werden dann als Klassifizierung mit Eins-zu-Viele-Beziehungen identifiziert.
Zusammenfassung:
- Das mehrdimensionale Schema wurde speziell zur Modellierung von Data Warehouse-Systemen entwickelt
- Das Sternschema ist der einfachste Typ eines Data Warehouse-Schemas. Es ist als Sternschema bekannt, da seine Struktur einem Stern ähnelt.
- Ein Schneeflockenschema ist eine Erweiterung eines Sternschemas und fügt zusätzliche Dimensionen hinzu. Es wird Schneeflocke genannt, weil sein Diagramm einer Schneeflocke ähnelt.
- In einem Sternschema definiert nur ein einzelner Join die Beziehung zwischen der Faktentabelle und allen Dimensionstabellen.
- Das Sternschema enthält eine Faktentabelle, die von Dimensionstabellen umgeben ist.
- Das Schneeflockenschema ist von einer Dimensionstabelle umgeben, die wiederum von einer Dimensionstabelle umgeben ist
- Ein Schneeflockenschema erfordert viele Verknüpfungen, um die Daten abzurufen.
- Ein Galaxy-Schema enthält zwei Faktentabellen, die Dimensionstabellen gemeinsam nutzen. Es wird auch als Faktenkonstellationsschema bezeichnet.
- Das Sternhaufenschema enthält Attribute des Stern- und Schneeflockenschemas.