Was ist OLAP?
Online Analytical Processing (OLAP) ist eine Softwarekategorie, mit der Benutzer Informationen aus mehreren Datenbanksystemen gleichzeitig analysieren können. Mit dieser Technologie können Analysten Geschäftsdaten aus verschiedenen Blickwinkeln extrahieren und anzeigen.
Analysten müssen häufig Daten gruppieren, aggregieren und verbinden. Diese Operationen in relationalen Datenbanken sind ressourcenintensiv. Mit OLAP können Daten vorberechnet und voraggregiert werden, wodurch die Analyse beschleunigt wird.
OLAP-Datenbanken sind in einen oder mehrere Cubes unterteilt. Die Cubes sind so konzipiert, dass das Erstellen und Anzeigen von Berichten einfach wird. OLAP steht für Online Analytical Processing.
In diesem Tutorial lernen Sie:
- OLAP-Würfel
- Grundlegende analytische Operationen von OLAP
- Arten von OLAP-Systemen
- ROLAP
- MOLAP
- Hybrid OLAP
- Vorteile von OLAP
- Nachteile von OLAP
OLAP-Würfel:
Das Herzstück des OLAP-Konzepts ist ein OLAP-Cube. Der OLAP-Cube ist eine Datenstruktur, die für eine sehr schnelle Datenanalyse optimiert ist.
Der OLAP-Cube besteht aus numerischen Fakten, die als Kennzahlen bezeichnet werden und nach Dimensionen kategorisiert sind. OLAP Cube wird auch als Hypercube bezeichnet .
Normalerweise werden Datenoperationen und -analysen mithilfe der einfachen Tabelle durchgeführt, in der die Datenwerte im Zeilen- und Spaltenformat angeordnet sind. Dies ist ideal für zweidimensionale Daten. OLAP enthält jedoch mehrdimensionale Daten, wobei Daten normalerweise aus einer anderen und nicht verwandten Quelle stammen. Die Verwendung einer Tabelle ist keine optimale Option. Der Cube kann mehrdimensionale Daten auf logische und geordnete Weise speichern und analysieren.
Wie funktioniert es?
Ein Data Warehouse extrahiert Informationen aus mehreren Datenquellen und Formaten wie Textdateien, Excel-Tabellen, Multimediadateien usw.
Die extrahierten Daten werden bereinigt und transformiert. Die Daten werden in einen OLAP-Server (oder OLAP-Cube) geladen, auf dem die Informationen für die weitere Analyse im Voraus vorberechnet werden.
Grundlegende analytische Operationen von OLAP
Vier Arten von Analysevorgängen in OLAP sind:
- Aufrollen
- Aufreißen
- In Würfel schneiden
- Schwenken (drehen)
1) Roll-up:
Roll-up wird auch als "Konsolidierung" oder "Aggregation" bezeichnet. Der Roll-up-Vorgang kann auf zwei Arten ausgeführt werden
- Abmessungen reduzieren
- Konzepthierarchie erklimmen. Die Konzepthierarchie ist ein System zum Gruppieren von Dingen nach ihrer Reihenfolge oder Ebene.
Betrachten Sie das folgende Diagramm
- In diesem Beispiel wurden die Städte New Jersey und Lost Angles in das Land USA gerollt
- Die Verkaufszahlen von New Jersey und Los Angeles betragen 440 bzw. 1560. Sie werden 2000 nach dem Aufrollen
- Bei diesem Aggregationsprozess werden die Standorthierarchien der Daten von der Stadt in das Land verschoben.
- Beim Aufrollen müssen mindestens eine oder mehrere Abmessungen entfernt werden. In diesem Beispiel wird die Quaterdimension entfernt.
2) Drilldown
Beim Drilldown werden Daten in kleinere Teile fragmentiert. Es ist das Gegenteil des Rollup-Prozesses. Dies kann über erfolgen
- Die Konzepthierarchie nach unten verschieben
- Eine Dimension vergrößern
Betrachten Sie das obige Diagramm
- Quater Q1 wird auf die Monate Januar, Februar und März heruntergebohrt. Entsprechende Verkäufe sind ebenfalls Register.
- In diesem Beispiel werden Dimensionsmonate hinzugefügt.
3) Scheibe:
Hier wird eine Dimension ausgewählt und ein neuer Unterwürfel erstellt.
Das folgende Diagramm erklärt, wie die Slice-Operation ausgeführt wurde:
- Die Dimensionszeit wird mit Q1 als Filter geschnitten.
- Insgesamt wird ein neuer Würfel erstellt.
Würfel:
Diese Operation ähnelt einem Slice. Der Unterschied bei den Würfeln besteht darin, dass Sie zwei oder mehr Dimensionen auswählen, die zur Erstellung eines Unterwürfels führen.
4) Pivot
In Pivot drehen Sie die Datenachsen, um eine Ersatzdarstellung der Daten bereitzustellen.
Im folgenden Beispiel basiert der Pivot auf Elementtypen.
Arten von OLAP-Systemen
OLAP Hierarchische Struktur
Art des OLAP | Erläuterung |
Relationales OLAP (ROLAP): | ROLAP ist ein erweitertes RDBMS zusammen mit einer mehrdimensionalen Datenzuordnung, um die standardmäßige relationale Operation auszuführen. |
Mehrdimensionales OLAP (MOLAP) | MOLAP Implementiert den Betrieb in mehrdimensionalen Daten. |
Hybrid OnlineAnalytical Processing (HOLAP) | Beim HOLAP-Ansatz werden die aggregierten Summen in einer mehrdimensionalen Datenbank gespeichert, während die detaillierten Daten in der relationalen Datenbank gespeichert werden. Dies bietet sowohl die Dateneffizienz des ROLAP-Modells als auch die Leistung des MOLAP-Modells. |
Desktop-OLAP (DOLAP) | In Desktop OLAP lädt ein Benutzer einen Teil der Daten lokal oder auf seinem Desktop aus der Datenbank herunter und analysiert sie. Die Bereitstellung von DOLAP ist relativ kostengünstig, da es im Vergleich zu anderen OLAP-Systemen nur sehr wenige Funktionen bietet. |
Web-OLAP (WOLAP) | Web-OLAP, ein OLAP-System, auf das über den Webbrowser zugegriffen werden kann. WOLAP ist eine dreistufige Architektur. Es besteht aus drei Komponenten: Client, Middleware und einem Datenbankserver. |
Mobiles OLAP: | Mit Mobile OLAP können Benutzer mit ihren Mobilgeräten auf OLAP-Daten zugreifen und diese analysieren |
Räumliche OLAP: | SOLAP wurde erstellt, um die Verwaltung von räumlichen und nicht räumlichen Daten in einem Geografischen Informationssystem (GIS) zu erleichtern. |
ROLAP
ROLAP arbeitet mit Daten, die in einer relationalen Datenbank vorhanden sind. Fakten und Dimensionstabellen werden als relationale Tabellen gespeichert. Es ermöglicht auch eine mehrdimensionale Analyse von Daten und ist das am schnellsten wachsende OLAP.
Vorteile des ROLAP-Modells:
- Hohe Dateneffizienz. Es bietet eine hohe Dateneffizienz, da die Abfrageleistung und die Zugriffssprache speziell für die mehrdimensionale Datenanalyse optimiert sind.
- Skalierbarkeit. Diese Art von OLAP-System bietet Skalierbarkeit für die Verwaltung großer Datenmengen und selbst dann, wenn die Daten stetig zunehmen.
Nachteile des ROLAP-Modells:
- Nachfrage nach höheren Ressourcen: ROLAP benötigt eine hohe Auslastung der Arbeits-, Software- und Hardwareressourcen.
- Insgesamt Datenbeschränkungen. ROLAP-Tools verwenden SQL für die gesamte Berechnung aggregierter Daten. Es gibt jedoch keine festgelegten Grenzen für die Verarbeitung von Berechnungen.
- Langsame Abfrageleistung. Die Abfrageleistung in diesem Modell ist im Vergleich zu MOLAP langsam
MOLAP
MOLAP verwendet Array-basierte mehrdimensionale Speicher-Engines, um mehrdimensionale Ansichten von Daten anzuzeigen. Grundsätzlich verwenden sie einen OLAP-Cube.
Erfahren Sie hier mehr über OLAP
Hybrid OLAP
Hybrid-OLAP ist eine Mischung aus ROLAP und MOLAP. Es bietet eine schnelle Berechnung von MOLAP und eine höhere Skalierbarkeit von ROLAP. HOLAP verwendet zwei Datenbanken.
- Aggregierte oder berechnete Daten werden in einem mehrdimensionalen OLAP-Cube gespeichert
- Detaillierte Informationen werden in einer relationalen Datenbank gespeichert.
Vorteile von Hybrid-OLAP:
- Diese Art von OLAP hilft, Speicherplatz zu sparen, und bleibt kompakt, wodurch Probleme im Zusammenhang mit der Zugriffsgeschwindigkeit und dem Komfort vermieden werden.
- Hybrid-HOLAPs verwenden die Cube-Technologie, die eine schnellere Leistung für alle Datentypen ermöglicht.
- ROLAP werden sofort aktualisiert und HOLAP-Benutzer haben Zugriff auf diese sofort aktualisierten Echtzeitdaten. MOLAP ermöglicht die Bereinigung und Konvertierung von Daten, wodurch die Datenrelevanz verbessert wird. Dies bringt das Beste aus beiden Welten.
Nachteile von Hybrid-OLAP:
- Höhere Komplexität : Der Hauptnachteil von HOLAP-Systemen besteht darin, dass sie sowohl ROLAP- als auch MOLAP-Tools und -Anwendungen unterstützen. Somit ist es sehr kompliziert.
- Mögliche Überschneidungen : Es besteht eine höhere Wahrscheinlichkeit von Überschneidungen, insbesondere in Bezug auf ihre Funktionen.
Vorteile von OLAP
- OLAP ist eine Plattform für alle Arten von Unternehmen, einschließlich Planung, Budgetierung, Berichterstellung und Analyse.
- Informationen und Berechnungen sind in einem OLAP-Cube konsistent. Dies ist ein entscheidender Vorteil.
- Erstellen und analysieren Sie schnell "Was wäre wenn" -Szenarien
- Durchsuchen Sie die OLAP-Datenbank ganz einfach nach allgemeinen oder spezifischen Begriffen.
- OLAP bietet die Bausteine für Geschäftsmodellierungstools, Data Mining-Tools und Tools für Leistungsberichte.
- Ermöglicht Benutzern das Erstellen von Slice- und Dice-Cube-Daten nach verschiedenen Dimensionen, Maßen und Filtern.
- Es ist gut für die Analyse von Zeitreihen.
- Mit OLAP ist es einfach, einige Cluster und Ausreißer zu finden.
- Es handelt sich um ein leistungsstarkes Online-Analyseprozesssystem zur Visualisierung, das schnellere Reaktionszeiten bietet
Nachteile von OLAP
- Für OLAP müssen Daten in einem Stern- oder Schneeflockenschema organisiert werden. Diese Schemata sind kompliziert zu implementieren und zu verwalten
- Sie können nicht viele Dimensionen in einem einzelnen OLAP-Cube haben
- Auf Transaktionsdaten kann mit dem OLAP-System nicht zugegriffen werden.
- Jede Änderung in einem OLAP-Cube erfordert eine vollständige Aktualisierung des Cubes. Dies ist ein zeitaufwändiger Prozess
Zusammenfassung:
- OLAP ist eine Technologie, mit der Analysten Geschäftsdaten aus verschiedenen Blickwinkeln extrahieren und anzeigen können.
- Das Herzstück des OLAP-Konzepts ist ein OLAP-Cube.
- Verschiedene Geschäftsanwendungen und andere Datenvorgänge erfordern die Verwendung von OLAP Cube.
- In OLAP gibt es hauptsächlich fünf Arten von Analysevorgängen: 1) Roll-up 2) Drilldown 3) Slice 4) Dice und 5) Pivot
- Drei Arten von weit verbreiteten OLAP-Systemen sind MOLAP, ROLAP und Hybrid-OLAP.
- Desktop-OLAP, Web-OLAP und Mobile-OLAP sind einige andere Arten von OLAP-Systemen.