Anzeige
IT-PRAXIS BEI DER CREDIT SUISSE8. August 2019

Fehlersuche per Operlog: Fehler in der IT-Produktion schneller finden – durch Online- und historische Daten

Boris Kemp, Director Product Strategy Beta Systems SoftwareBeta Systems Software

In z/OS-Umgebungen eines Rechenzentrums entstehen bei großen Unternehmen Tag für Tag Millionen von Meldungen, von Benutzeranmeldungen bis zu Hinweisen auf kritische Fehler. Operlog-Daten als spezielles Logstream-Format spielen hier eine besondere Rolle. Damit werden Kommunikationen über Programme und Systemfunktionen von jedem System in einem Sysplex aufgezeichnet und zusammenführt. IBM empfiehlt JES3-Kunden mit einem Multisystem-Systemkomplex die Verwendung von Operlog-Logstream, gleichzeitig sollten JES3 DLOG und SYSLOG ausgeschaltet werden. Operlog kann auch als reiner DASD-Protokollstrom verwendet werden. Für die Fehlersuche.

von Boris Kemp, Director Product Strategy Beta Systems Software

Administratoren in Großunternehmen wissen, wie zeitaufwändig die Arbeit mit diesem speziellen Format ist und wie viel Know-how dafür erforderlich ist. Operlog-Daten liegen entweder aktuell (online) vor oder sie sind bereits archiviert. Sowohl auf Online- wie auf archivierte Daten muss der Administrator zugreifen, wenn er die Ursachen für bestimmte Fehler oder Probleme im z/OS-Umfeld nachvollziehen will.

Produktvorstellung: Operlog Tools
Fehlersuche per OperlogDie „Operlog Tool­s“ von Be­ta Sys­tems be­ste­hen aus drei Kom­po­nen­ten: Logs­tream Ma­na­ger, Operlog Ma­na­ger und Sys­plex Com­mu­ni­ca­tor. Der Logs­tream Ma­na­ger als Ba­sis­tool soll Sys­tem­pro­gram­mie­rern die Aus­wahl von Logs­treams er­leich­tern und bei Sor­tie­rung, An­zei­ge der De­fi­ni­ti­on und Ein­stel­lun­gen, Klo­nen ei­nes oder meh­re­rer Streams u.a. un­ter­stüt­zen. Der Operlog Ma­na­ger bie­tet Hil­fe­stel­lung bei der Hand­ha­bung von Operlog-/Sys­log-Da­ten – ei­ne Ar­beit, für die sonst zwei se­pa­ra­te Tools für ak­tu­el­le und Ar­chiv­da­ten not­wen­dig wä­ren. Er er­mög­licht ei­nen in­di­vi­du­el­len Zu­griff auf die z/OS OPERLOG-Funk­ti­on. Un­ter­stützt wer­den TSO/ISPF und Batch-Zu­grif­fe.

Zu­griff auf Operlog über SAF-De­fi­ni­tio­nen steu­ern

Über die Batch-Schnitt­stel­le kön­nen Operlog-Da­ten im Hin­ter­grund aus­ge­wählt so­wie im SYS­LOG- und/oder MDB-For­mat (Nach­rich­ten­da­ten­block) ge­spei­chert wer­den. Die ge­spei­cher­ten Da­ten sind über ei­nen vom Kun­den ge­wähl­ten Zeit­raum mit der glei­chen Schnitt­stel­le und Aus­stat­tung ver­füg­bar. Die­se Ma­nage­ment-Funk­ti­on löst auch das Pro­blem des Zu­griffs auf die Operlog-Da­ten in­ner­halb ei­nes gro­ßen Sys­tems mit ver­schie­de­nen Be­nut­zern/Kun­den. Der Zu­griff auf Operlog kann über SAF-De­fi­ni­tio­nen ge­steu­ert und sys­tem­be­zo­gen fest­ge­legt wer­den. Ein wich­ti­ges Si­cher­heits­merk­mal, das zu­dem ho­he Kon­trol­le und Über­sicht über die Da­ten er­mög­licht. Für die Kom­mu­ni­ka­ti­on mit Sys­plex greift der Logs­tream Ma­na­ger auf die of­fe­ne Ba­sic Sys­plex (XCF)-Schnitt­stel­le zu­rück. Als drit­te Kom­po­nen­te fun­giert da­her ein Sys­plex Communicator.

Für jede Zugriffsart sind üblicherweise verschiedene Systeme notwendig: 1. die IBM-eigene System Display and Search Facility (SDSF) – oder ein ähnliches Produkt – für aktuelle Daten sowie 2. ein Archivsystem für die abgelegten Daten. Das bedeutet stets: zwei verschiedene Oberflächen, voneinander abweichende Kommandostrukturen, die zu beachten sind, ergo: Zeit- und Arbeitsaufwand für den Administrator, der sich in unterschiedliche Systeme einarbeiten muss.

Die Credit Suisse Group AG setzt seit einiger Zeit ein Werkzeug ein, das beide Ansätze vereint – die „Operlog Tools“ von Beta Systems. Rund 100 User arbeiten bei dem Finanzdienstleister mit der Lösung. Sie verwaltet sowohl den Online- wie den archivierten Bestand über eine gemeinsame Oberfläche. Der Administrator kann Meldungen einzeln aussortieren, sie selektieren, bisherige Selektionskriterien sichern und wiederverwenden usw. Vergleichbare Tools wurden von der IBM-Community in der Vergangenheit nur schlecht angenommen. Anwender sind vor allem Großunternehmen, die traditionell mit IBM-Infrastrukturen arbeiten: Versicherungen, Banken, Krankenkassen und auch Behörden.

Herkömmliche Fehlersuche blockiert Ressourcen

Bislang mussten die RZ-Administratoren der Credit Suisse Fehler im Produktionsbetrieb stets manuell aufspüren. Dies hatte mühsame und zeitaufwändige Suchen zur Folge, gerade in kritischen Situationen mit hoher Management Attention, in denen Fehler auftraten, die zum Stopp der IT-Produktion führten und innerhalb kürzester Zeit behoben werden mussten. Es führte zudem nicht selten zur Blockade von Ressourcen bei der Fehlersuche, die so nicht für andere Zwecke verwendet werden konnten.

Risiken ungewollter Ausfälle minimiert

Die Credit Suisse Group AG hat dadurch die Fehlersuche in ihrer IT-Produktion stark vereinfacht. Risiken ungewollter Ausfälle wurden minimiert, ebenso die Zeit für die Fehlereingrenzung. Dies funktioniert über flexible Suchmöglichkeiten. In den meisten Fällen sind bei Problemanalysen einzelne verdächtige oder kritische Nachrichten, Nachrichtenteile oder Jobs bekannt. Oft ist es jedoch auch wichtig zu wissen, welche Meldungen unmittelbar vor oder nach einem Ereignis geschrieben wurden. Der Benutzer kann in dem Tool daher einen Zeitraum in Sekunden angeben, für den Meldungen vor oder nach Ereignissen angezeigt werden.

Autor Boris Kemp, Beta Systems
Boris Kemp ist seit knapp 5 Jahren Director Product Strategy – ‎Internet und Informationstechnologie bei der Beta Systems Software (Website). Zuvor arbeitete er unter anderem als Projektleiter bei AIOS und IT-Leiter bei der E*TRADE Bank.

Selektionskriterien

Wichtig sind zudem Selektionskriterien, d.h. der Administrator kann Jobs nach Datum, Zeit, Systemname, Jobname, Job-ID, Nachrichten-ID sowie Text filtern. Das Abspeichern einmal verwendeter Filtereinstellungen und ihre Wiederverwendung bei der nächsten Suche erleichtern die Fehlersuche ebenfalls. So muss man nicht stets von vorn anfangen.

Wert legt Credit Suisse ferner auf Übersichtlichkeit. Das Anzeigen oder Ausblenden ausgewählter Nachrichten, Nachrichtenarten oder Systemnamen, die Einblendung von Befehlen nur bestimmter Konsolen oder die Trennung mehrzeiliger Nachrichten sind Features, welche die Fehlersuche für die Administratoren in ihrer täglichen Praxis deutlich vereinfachen.Boris Kemp, Beta Systems Software

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert