Was ist Systemüberwachung?
Die Systemüberwachung ist eine tägliche Routinetätigkeit. Dieses Dokument enthält eine systematische Schritt-für-Schritt-Anleitung für die Serverüberwachung. Es gibt einen Überblick über technische Aspekte und Konzepte für eine proaktive Systemüberwachung. Nur wenige von ihnen sind:
- Überprüfen der Anwendungsserver.
- Überwachung systemweiter Arbeitsprozesse.
- Überwachung von Arbeitsprozessen für einzelne Instanzen.
- Sperreinträge überwachen.
- CPU-Auslastung
- Verfügbarer Speicherplatz in der Datenbank.
- Aktualisierungsprozesse überwachen.
- Systemprotokoll überwachen.
- Pufferstatistik
Einige andere sind:
- Überwachen von Stapeljobs
- Spool Request Monitoring.
- Anzahl der Druckaufträge
- ABAP-Dump-Analyse.
- Datenbankleistungsmonitor.
- Datenbankprüfung.
- Überwachen von Anwendungsbenutzern.
Warum tägliche Basisprüfungen / Systemüberwachung?
Wie überwachen wir ein SAP-System?
Überprüfen der Anwendungsserver (SM51)
Diese Transaktion wird verwendet, um alle aktiven Anwendungsserver zu überprüfen.
Hier sehen Sie, welche Services oder Workprozesse in jeder Instanz konfiguriert sind.
Überwachen von Arbeitsprozessen für einzelne Instanzen SM50:
Zeigt alle laufenden, wartenden, gestoppten und PRIV-Prozesse an, die sich auf eine bestimmte Instanz beziehen. In diesem Schritt überprüfen wir alle Prozesse; Der Prozessstatus sollte immer warten oder ausgeführt werden. Wenn ein Prozess einen anderen Status als Warten oder Ausführen hat, müssen wir diesen bestimmten Prozess überprüfen und entsprechend Bericht erstatten.
Diese Transaktion zeigt viele Informationen wie:
- Status des Arbeitsprozesses (ob besetzt oder nicht)
- Wenn der Arbeitsprozess ausgeführt wird, können Sie die von ihm ausgeführte Aktion möglicherweise in der Spalte Aktion anzeigen.
- Sie können festlegen, an welcher Tabelle gearbeitet wird
Einige der typischen Probleme:
- Der Benutzer benötigt viel Zeit, um sich anzumelden / kann sich nicht anmelden / Online-Transaktion sehr langsam. Dies könnte darauf zurückzuführen sein, dass die DIA-Arbeitsprozesse voll ausgelastet sind. Dies kann auch auf lange laufende Jobs zurückzuführen sein (rote Anzeige in der Spalte Zeit). Bei Bedarf können Sie die Sitzung abbrechen, indem Sie die Jobs auswählen und dann zu Prozess> Ohne Kern abbrechen gehen. Dadurch wird der Job abgebrochen und der Arbeitsprozess für andere Benutzer / Prozesse freigegeben
- Einige Benutzer haben möglicherweise den PRIV-Status in der Spalte Grund . Dies kann sein, dass die Benutzertransaktion so groß ist, dass mehr Speicher benötigt wird. In diesem Fall gehört der DIA-Arbeitsprozess dem Benutzer und lässt andere Benutzer nicht verwenden. Wenden Sie sich in diesem Fall an den Benutzer und führen Sie den Job nach Möglichkeit als Hintergrundjob aus.
- Wenn der SPO-Arbeitsprozess einen langen Druckauftrag enthält, untersuchen Sie das Problem. Möglicherweise liegt ein Problem mit dem Druckserver oder Drucker vor.
Überwachung systemweiter Arbeitsprozesse (SM66)
Durch Überprüfen der Arbeitsprozesslast mithilfe der globalen Arbeitsprozessübersicht können wir schnell die mögliche Ursache eines Systemleistungsproblems untersuchen.
Überwachen der Arbeitsprozesslast auf allen aktiven Instanzen im gesamten System Auf
dem Bildschirm "Globale Arbeitsprozessübersicht" können Sie auf einen Blick Folgendes sehen:
- Der Status jedes Anwendungsservers
- Der Grund, warum es nicht läuft
- Ob es neu gestartet wurde
- Die CPU und die Anforderungslaufzeit
- Der Benutzer, der sich angemeldet hat, und der Client, bei dem er sich angemeldet hat
- Der Bericht, der ausgeführt wird
Anwendungsbenutzer überwachen (AL08 und SM04)
Diese Transaktion zeigt alle Benutzer aktiver Instanzen an.
Überwachen von Aktualisierungsprozessen (SM13)
Führen Sie die Transaktion SM13 aus, geben Sie ' * ' in das Feld USER ein und klicken Sie auf
Wenn keine langen ausstehenden Aktualisierungsdatensätze vorhanden sind oder keine Aktualisierungen durchgeführt werden, ist diese Warteschlange leer, wie im folgenden Screenshot gezeigt.
Wenn das Update jedoch nicht aktiv ist, finden Sie die folgenden Informationen:
- Ist das Update aktiv, wenn nicht, wurde es vom System oder von einem Benutzer deaktiviert?
- Klicke auf Schaltfläche und erhalten Sie die Informationen.
- Klicke auf Schaltfläche und erhalten Sie die folgenden Informationen:
- Wird ein Update abgebrochen?
- Gibt es eine lange Warteschlange ausstehender Updates, die älter als 10 Minuten sind?
Überwachen von Sperreinträgen (SM12)
Führen Sie die Transaktion SM12 aus und geben Sie '*' in das Feld Benutzername ein
SAP bietet einen Sperrmechanismus, um zu verhindern, dass andere Benutzer den Datensatz ändern, an dem Sie arbeiten. In einigen Situationen werden Sperren nicht freigegeben. Dies kann passieren, wenn die Benutzer aufgrund eines Netzwerkproblems abgeschnitten werden, bevor sie die Sperre aufheben können.
Diese alten Sperren müssen gelöscht werden, da dies den Zugriff oder Änderungen an den Datensätzen verhindern kann.
Wir können Sperrstatistiken verwenden, um die im System festgelegten Sperren zu überwachen. Wir zeichnen nur die Sperreinträge auf, die den Datums- und Zeitstempel des vorherigen Tages haben.
Überwachungssystemprotokoll (SM21)
Wir können das Protokoll verwenden, um Fehler im System und in seiner Umgebung zu lokalisieren und zu beheben.
- Geben Sie Datum und Uhrzeit ein.
- Wählen Sie Optionsfeldprobleme und Warnungen
- Drücken Sie auf Systemprotokoll erneut lesen.
Tune Summary (ST02)
Schritt 1: Gehen Sie zu ST02, um die Tune-Zusammenfassung zu überprüfen.
Schritt 2: Wenn Sie in SWAPS rote Werte sehen, doppelklicken Sie auf diese.
Schritt 3: Klicken Sie im folgenden Bildschirm auf die Registerkarte 'Aktuelle Parameter'.
Schritt 4: Notieren Sie den Wert und die Profilparameter
Schritt 5: Gehen Sie zu RZ10 (um die Profilparameterwerte zu ändern).
Schritt 6: Speichern Sie die Änderungen.
Schritt 7: Starten Sie den Server neu, um den neuen Änderungseffekt zu übernehmen.
CPU-Auslastung (ST06)
Die CPU-Auslastung im Leerlauf muss zwischen 60 und 65% liegen. Wenn sie den Wert überschreitet, müssen wir mindestens die folgenden Punkte überprüfen:
- Führen Sie Befehle auf Betriebssystemebene aus - oben und überprüfen Sie, welche Prozesse die meisten Ressourcen beanspruchen.
- Gehen Sie zu SM50 oder SM66. Überprüfen Sie, ob Aufträge mit langer Laufzeit oder lange Aktualisierungsabfragen ausgeführt werden.
- Gehen Sie zu SM12 und überprüfen Sie die Sperreinträge
- Gehen Sie zu SM13 und aktivieren Sie den Status Aktiven aktualisieren.
- Überprüfen Sie SM21 auf Fehler.
ABAP Dumps (ST22)
Hier prüfen wir die Müllkippen des Vortages
Spool Request Monitoring (SP01)
Führen Sie für die Überwachung der Spool-Anforderung SP01 aus und wählen Sie Folgendes aus:
- Geben Sie '*' in das Feld Erstellt von ein
- Klicke auf Schaltfläche ausführen.
Hier zeichnen wir nur die Anfragen auf, die mit Problemen beendet werden.
Überwachen von Stapeljobs (SM37)
Führen Sie zum Überwachen von Hintergrundjobs SM37 aus und wählen Sie Folgendes aus:
- Geben Sie '*' in das Feld Benutzername und Jobname ein
- Wählen Sie im Auftragsstatus Folgendes aus: Geplante, abgebrochene, freigegebene und abgeschlossene Anforderungen.
Transaktions-RFC-Administration (SM58)
Transaktions-RFC (tRFC, ursprünglich auch als asynchroner RFC bezeichnet) ist eine asynchrone Kommunikationsmethode, die den aufgerufenen Funktionsbaustein im RFC-Server nur einmal ausführt.
Wir müssen den Anzeigezeitraum auswählen, für den wir die tRFCs anzeigen möchten, und dann im Feld Benutzername '*' auswählen, um alle Aufrufe anzuzeigen, die nicht korrekt ausgeführt wurden oder in der Warteschlange warten.
QRFC-Administration (Outbound Queue -SMQ1)
Wir sollten hier den Client-Namen angeben und prüfen, ob ausgehende qRFCs im Warte- oder Fehlerzustand sind.
QRFC-Administration (Inbound Queue -SMQ2)
Wir sollten hier den Client-Namen angeben und prüfen, ob eingehende qRFCs im Warte- oder Fehlerzustand sind.
Datenbankverwaltung (DB02)
Nachdem Sie im ersten Bildschirm Aktuelle Größen ausgewählt haben, gelangen Sie zum folgenden Bildschirm, in dem der aktuelle Status aller Tablespaces im System angezeigt wird.
Wenn einer der Tablespaces mehr als 95% beträgt und die automatische Ausdehnung deaktiviert ist, müssen wir eine neue Datendatei hinzufügen, damit die Datenbank nicht voll ist.
Wir können hier Monate, Wochen oder Tage auswählen, um die Änderungen zu sehen, die in einem Tabellenbereich stattfinden.
Datenbanksicherungsprotokolle (DB12)
Aus dieser Transaktion konnten wir feststellen, wann die letzte erfolgreiche Sicherung des Systems war. Wir können die Backups des Vortages überprüfen und feststellen, ob alles in Ordnung war oder nicht.
Wir können auch die Redo-Log-Dateien überprüfen und feststellen, ob die Redo-Log-Sicherung erfolgreich war oder nicht.
Kurzübersicht
Tägliche Überwachungsaufgaben
- Kritische Aufgaben
- SAP-System
- Datenbank
Kritische Aufgaben
Nein | Aufgabe | Transaktion | Vorgehensweise / Bemerkung |
---|---|---|---|
1 | Überprüfen Sie, ob das R / 3-System aktiv ist. | Melden Sie sich beim R / 3-System an | |
2 | Überprüfen Sie, ob die tägliche Sicherung fehlerfrei ausgeführt wurde | DB12 | Überprüfen Sie die Datenbanksicherung. |
SAP-System
Nein | Aufgabe | Transaktion | Vorgehensweise / Bemerkung |
---|---|---|---|
1 | Überprüfen Sie, ob alle Anwendungsserver aktiv sind. | SM51 | Überprüfen Sie, ob alle Server aktiv sind. |
2 | Überprüfen Sie die Arbeitsprozesse (gestartet von SM51). | SM50 | Alle Arbeitsprozesse mit dem Status "Laufen" oder "Warten" |
3 | Überblick über den globalen Arbeitsprozess | SM66 | Stellen Sie sicher, dass kein Arbeitsprozess länger als 1800 Sekunden ausgeführt wird |
3 | Suchen Sie nach fehlgeschlagenen Updates (Update wird beendet). | SM13 |
|
4 | Überprüfen Sie das Systemprotokoll. | SM21 | Stellen Sie Datum und Uhrzeit auf vor der letzten Protokollüberprüfung ein. Überprüfe auf:
|
5 | Überprüfen Sie, ob Aufträge abgebrochen wurden. | SM37 | Geben Sie ein Sternchen (*) in die Benutzer-ID ein. Überprüfen Sie, ob alle kritischen Jobs erfolgreich waren. |
6 | Überprüfen Sie, ob „alte“ Schlösser vorhanden sind. | SM12 | Geben Sie ein Sternchen (*) für die Benutzer-ID ein. |
7 | Suchen Sie nach Benutzern im System. | SM04AL08 | Überprüfen Sie, ob eine unbekannte oder andere Benutzer-ID und ein anderes Terminal vorhanden sind. Diese Aufgabe sollte mehrmals täglich ausgeführt werden. |
8 | Überprüfen Sie, ob Spulenprobleme vorliegen. | SP01 | Geben Sie ein Sternchen (*) für Created ByLook für Spool-Jobs ein, die seit über einer Stunde in Bearbeitung sind. |
9 | Überprüfen Sie das Auftragsprotokoll | SM37 | Überprüfe auf:
|
10 | Überprüfen und Beheben von Speicherauszügen. | ST22 | Suchen Sie nach einer übermäßigen Anzahl von Dumps. Suchen Sie nach Deponien ungewöhnlicher Art. |
11 | Überprüfen Sie die Pufferstatistik. | ST02 | Suchen Sie nach Swaps. |
Datenbank
Nein | Aufgabe | Transaktion | Vorgehensweise / Bemerkung |
---|---|---|---|
1 | Überprüfen Sie das Fehlerprotokoll auf Probleme. | ST04 | |
2 | Database GrowthMissing Indizes | DB02 | Wenn der Tablespace zu mehr als 90% verwendet wird, fügen Sie ihm eine neue Datendatei hinzu. Erstellen Sie die fehlenden Indizes neu |
3 | Datenbankstatistikprotokoll | DB13 |