SAP HANA Architecture, LandScape, Sizing: Vollständiges Tutorial

Die SAP HANA-Datenbank ist eine auf den Hauptspeicher ausgerichtete Datenverwaltungsplattform. Die SAP HANA-Datenbank läuft auf SUSE Linux Enterprises Server und baut auf der C ++ - Sprache auf.

Die SAP-HANA-Datenbank kann auf mehrere Maschinen verteilt werden.

Die Vorteile von SAP HANA sind wie folgt:

SAP HANA ist nützlich, da es sehr schnell ist, da alle Daten im Arbeitsspeicher geladen sind und keine Daten von der Festplatte geladen werden müssen.
SAP HANA kann für OLAP (Online-Analyse) und OLTP (Online-Transaktion) in einer einzigen Datenbank verwendet werden.

Die SAP HANA-Datenbank besteht aus einer Reihe von In-Memory-Verarbeitungsmodulen. Die Berechnungs-Engine ist die wichtigste In-Memory-Verarbeitungs-Engine in SAP HANA. Es funktioniert mit anderen Verarbeitungsmodulen wie dem relationalen Datenbankmodul (Zeilen- und Spaltenmodul), dem OLAP-Modul usw.

Die relationale Datenbanktabelle befindet sich im Spalten- oder Zeilenspeicher.

Es gibt zwei Speichertypen für die SAP-HANA-Tabelle.

Zeilentypspeicher (für Zeilentabelle).
Spaltentypspeicher (für Spaltentabelle).

Textdaten und Grafikdaten befinden sich in Text Engine bzw. Graph Engine. Es gibt einige weitere Engines in der SAP HANA-Datenbank. Die Daten dürfen in diesen Engines gespeichert werden, solange genügend Speicherplatz verfügbar ist.

In diesem Tutorial lernen Sie:

SAP-HANA-Architektur
SAP HANA Landschaft
SAP HANA Sizing

SAP-HANA-Architektur

Daten werden durch verschiedene Komprimierungstechniken (z. B. Wörterbuchcodierung, Lauflängencodierung, Sparse-Codierung, Cluster-Codierung, indirekte Codierung) im SAP HANA Column Store komprimiert.

Wenn das Hauptspeicherlimit in SAP HANA erreicht ist, werden die gesamten Datenbankobjekte (Tabelle, Ansicht usw.), die nicht verwendet werden, aus dem Hauptspeicher entladen und auf der Festplatte gespeichert.

Diese Objektnamen werden durch die Anwendungssemantik definiert und bei Bedarf erneut von der Festplatte in den Hauptspeicher geladen. Unter normalen Umständen verwaltet die SAP-HANA-Datenbank das automatische Entladen und Laden von Daten.

Der Benutzer kann jedoch Daten aus einzelnen Tabellen manuell laden und entladen, indem er eine Tabelle in SAP HANA Studio im entsprechenden Schema auswählt, indem er mit der rechten Maustaste klickt und die Option "Entladen / Laden" auswählt.

SAP HANA Server besteht aus

Indexserver
Präprozessorserver
Name Server
Statistikserver
XS-Motor

SAP HANA Index Server
SAP HANA Database Hauptserver sind Indexserver. Details zu jedem Server sind wie folgt:

Es ist die Hauptkomponente der SAP-HANA-Datenbank
Es enthält die tatsächlichen Datenspeicher und die Engine zur Verarbeitung der Daten.
Index Server verarbeitet eingehende SQL- oder MDX-Anweisungen.

Unten finden Sie die Architektur von Index Server.

Übersicht über den SAP HANA Index Server

Sitzungs- und Transaktionsmanager: Die Sitzungskomponente verwaltet Sitzungen und Verbindungen für die SAP-HANA-Datenbank. Transaction Manager koordiniert und steuert Transaktionen.

SQL- und MDX-Prozessor: Die SQL-Prozessorkomponente fragt Daten ab und sendet sie in der Abfrageverarbeitungs-Engine, dh SQL / SQL Script / R / Calc Engine, an diese. Der MDX-Prozessor fragt mehrdimensionale Daten ab und bearbeitet sie (z. B. analytische Ansicht in SAP HANA).

SQL / SQL-Skript / R / Calc-Engine: Diese Komponente führt die Konvertierung von SQL / SQL-Skripten und Berechnungsdaten in das Berechnungsmodell aus.

Repository: Das Repository verwaltet die Versionierung des SAP-HANA-Metadatenobjekts, z. B. (Attributansicht, Analyseansicht, gespeicherte Prozedur).

Persistenzschicht: Diese Schicht verwendet die integrierte Funktion "Disaster Recovery" der SAP-HANA-Datenbank. Das Backup wird darin als Speicherpunkt im Datenvolumen gespeichert.

Präprozessorserver

Dieser Server wird in der Textanalyse verwendet und extrahiert Daten aus einem Text, wenn die Suchfunktion verwendet wird.

Name Server

Dieser Server enthält alle Informationen zur Systemlandschaft. Auf einem verteilten Server enthält der Nameserver Informationen zu jeder laufenden Komponente und zum Speicherort der Daten auf dem Server. Dieser Server enthält Informationen zu dem Server, auf dem Daten vorhanden sind.

Statistikserver

Der Statistikserver ist für die Erfassung der Daten in Bezug auf Status, Ressourcenzuweisung / -verbrauch und Leistung des SAP-HANA-Systems verantwortlich.

XS Server

XS Server enthält XS Engine. Es ermöglicht externen Anwendungen und Entwicklern, die SAP-HANA-Datenbank über den XS Engine-Client zu verwenden. Die externe Clientanwendung kann HTTP verwenden, um Daten über die XS-Engine für den HTTP-Server zu übertragen.

SAP HANA Landschaft

"HANA" bedeutet High Performance Analytic Appliance ist eine Kombination aus Hardware- und Softwareplattform.

Aufgrund der Änderung der Computerarchitektur ist der leistungsstärkere Computer in Bezug auf CPU, RAM und Festplatte verfügbar.
SAP HANA ist die Lösung für Leistungsengpässe, bei denen alle Daten im Hauptspeicher gespeichert werden und nicht häufig Daten von der Festplatten-E / A in den Hauptspeicher übertragen werden müssen.

Nachfolgend finden Sie SAP HANA Innovation im Bereich Hardware / Software.

In SAP HANA gibt es zwei Arten von relationalen Datenspeichern: Zeilenspeicher und Spaltenspeicher.

Zeilenspeicher

Es ist dasselbe wie bei einer herkömmlichen Datenbank, z. B. (Oracle, SQL Server). Der einzige Unterschied besteht darin, dass alle Daten im Zeilenspeicherbereich im Speicher von SAP HANA gespeichert werden, im Gegensatz zu einer herkömmlichen Datenbank, in der Daten auf der Festplatte gespeichert sind.

Spaltenspeicher

Der Spaltenspeicher ist Teil der SAP-HANA-Datenbank und verwaltet die Daten im SAP-HANA-Speicher spaltenweise. Spaltentabellen werden im Spaltenspeicherbereich gespeichert. Der Spaltenspeicher bietet eine gute Leistung für Schreibvorgänge und optimiert gleichzeitig den Lesevorgang.

Die Leistung des Lese- und Schreibvorgangs wurde mit der folgenden Datenstruktur optimiert.

Hauptspeicher

Der Hauptspeicher enthält den Hauptteil der Daten. Im Hauptspeicher wird eine geeignete Datenkomprimierungsmethode (Wörterbuchcodierung, Clustercodierung, spärliche Codierung, Lauflängencodierung usw.) angewendet, um Daten zu komprimieren, um Speicherplatz zu sparen und die Suche zu beschleunigen.

Im Hauptspeicher sind Schreibvorgänge für komprimierte Daten kostspielig, sodass Schreibvorgänge komprimierte Daten im Hauptspeicher nicht direkt ändern. Stattdessen werden alle Änderungen in einem separaten Bereich im Spaltenspeicher geschrieben, der als "Delta-Speicher" bezeichnet wird.
Der Delta-Speicher ist für einen Schreibvorgang optimiert und verwendet die normale Komprimierung. Die Schreibvorgänge sind im Hauptspeicher nicht zulässig, jedoch im Delta-Speicher. Lesevorgänge sind in beiden Speichern zulässig.

Wir können Daten manuell in den Hauptspeicher laden, indem wir die Option "In den Speicher laden" und Daten aus dem Hauptspeicher mit der Option "Aus dem Speicher entladen" entladen, wie unten gezeigt.

Delta Storage

Delta-Speicher wird für einen Schreibvorgang verwendet und verwendet die grundlegende Komprimierung. Alle nicht festgeschriebenen Änderungen an Spaltentabellendaten, die im Delta-Speicher gespeichert sind.

Wenn wir diese Änderungen in den Hauptspeicher verschieben möchten, verwenden Sie "Delta Merge Operation" von SAP HANA Studio wie folgt:

Der Zweck der Delta-Merge-Operation besteht darin, Änderungen, die im Delta-Speicher gesammelt werden, in den Hauptspeicher zu verschieben.
Nach dem Ausführen der Delta Merge-Operation für die SAP-Spaltentabelle wird der Inhalt des Hauptspeichers auf der Festplatte gespeichert und die Komprimierung neu berechnet.

Prozess des Verschiebens von Daten von Delta in den Hauptspeicher während der Delta-Zusammenführung

Es gibt einen Pufferspeicher (L1-Delta), bei dem es sich um einen Zeilenspeicher handelt. In SAP HANA verhält sich die Spaltentabelle aufgrund von L1-Delta wie ein Zeilenspeicher.

Der Benutzer führt eine Update / Insert-Abfrage für die Tabelle aus (Physical Operator ist SQL-Anweisungen.).
Die Daten gehen zuerst zu L1. Wenn L1 Daten weiter verschiebt (L1 - Nicht festgeschriebene Daten)
Dann gehen die Daten in den spaltenorientierten L2-Delta-Puffer. (L2 - Festgeschriebene Daten)
Wenn der L2-Delta-Prozess abgeschlossen ist, werden die Daten in den Hauptspeicher verschoben.

Daher ist der Spaltenspeicher aufgrund von L1-Delta bzw. Hauptspeicher sowohl schreib- als auch schreiboptimiert. L1-Delta enthält alle nicht festgeschriebenen Daten. Festgeschriebene Daten werden über L2-Delta in den Hauptspeicher verschoben. Vom Hauptspeicher gehen die Daten zur Persistenzschicht (Der hier angezeigte Pfeil ist ein physischer Operator, der eine SQL-Anweisung im Spaltenspeicher sendet). Nach der Verarbeitung der SQL-Anweisung im Spaltenspeicher werden die Daten in die Persistenzschicht verschoben.

ZB unten ist zeilenbasierte Tabelle-

Tabellendaten werden im linearen Format auf der Festplatte gespeichert. Nachfolgend finden Sie das Format, wie Daten für die Zeilen- und Spaltentabelle auf der Festplatte gespeichert werden.

Im SAP-HANA-Speicher wird diese Tabelle im Zeilenspeicher auf der Festplatte als Format gespeichert.

Speicheradresse

Und in Spalte werden Daten auf der Festplatte gespeichert als -

Speicheradresse

Die Daten werden spaltenweise im linearen Format auf der Festplatte gespeichert. Daten können durch Komprimierungstechnik komprimiert werden.

Der Spaltenspeicher hat also den Vorteil, dass er Speicherplatz spart.

SAP HANA Sizing

Die Größe ist ein Begriff, der verwendet wird, um die Hardwareanforderungen für SAP-HANA-Systeme wie RAM, Festplatte und CPU usw. zu bestimmen.

Die wichtigste wichtige Größenkomponente ist der Speicher, und die zweite wichtige Größenkomponente ist die CPU. Die dritte Hauptkomponente ist eine Festplatte, deren Größe jedoch vollständig vom Speicher und der CPU abhängt.

Bei der Implementierung von SAP HANA besteht eine der entscheidenden Aufgaben darin, die richtige Größe eines Servers entsprechend den Geschäftsanforderungen zu ermitteln.

SAP HANA DB unterscheiden sich in der Größe mit normalem DBMS in Bezug auf -

Hauptspeicherbedarf für SAP HANA (Die Speichergröße wird durch Metadaten und Transaktionsdaten in SAP HANA bestimmt.)
CPU-Anforderung für SAP HANA (Prognose-CPU wird als nicht korrekt eingeschätzt).
Speicherplatzbedarf für SAP HANA (Wird für die Datenpersistenz und für die Protokollierung von Daten berechnet)

Die Anwendungsserver-CPU und der Anwendungsserverspeicher bleiben unverändert.

Für die Größenberechnung hat SAP verschiedene Richtlinien und Methoden zur Berechnung der korrekten Größe bereitgestellt.

Wir können unten Methode verwenden-