Anzeige
ARCHIV23. Oktober 2017

SIA „Always-On“-Zahlungs­dienste: Zwei Rechenzentren, 100% simultan – RTO in Sekunden statt in Stunden

SIA

„Active-Active-Projekt”: Zwei Rechenzentren, die dutzende Kilometer voneinander entfernt sind, verarbeiten gleichzeitig und in Echtzeit eine Vielzahl an Anwendungen, bei denen alle Daten sämtlicher Zahlungstransaktionen jederzeit auf demselben Stand sind. Fabio Grignani, SIA Senior Vice President und COO erklärt, was sich hinter dem Projekt verbirgt.

von Fabio Grignani, SIA COO & Senior Vice President

Ein neues System zur Notfallwiederherstellung (Disaster Recovery) einzuführen, das der herkömmlichen Methode mit einem Primär- und Sekundärrechenzentrum überlegen ist, und einen Weiterbetrieb innerhalb von wenigen Minuten sicherzustellen, während die parallel geschalteten Standorte dutzende Kilometer entfernt sind. Das sind die Kernmerkmale von SIAs “Active-Active”-Projekt.

Elektronisches Geld kommt. Die Zahlungswege nehmen zu. Und große ZV-Player stehen vor der Tür. In der neuen Welt des ZVs haben Unterbrechungen bei der Zahlungsabwicklung starke finanzielle Auswirkungen.”

Neue Ansätze zur Sicherung der Geschäftskontinuität und der Systemwiederherstellungs-Infrastrukturen werden notwendig. Bisher wurde das mit einem Primär-RZ als Host für laufende Dienstleistungen unter „normalen“ Bedingungen umgesetzt, während das Sekundäre so aufgesetzt ist, dass dort dieselben Applikationen und Dienstleistungen laufen können, wenn es zu einer Störung kommt. Beide RZs müssen an unterschiedlichen Standorten liegen – idealerweise einige Kilometer voneinander entfernt. SIA nennt diese Architektur “Active-Passive”: Im Katastrophenfall muss eine Organisation vom unbenutzbar gewordenen aktiven Standort zum anderen Standort (Passive) umschalten können. Dieser wird dann aktiviert, damit die Anwendungen weiterlaufen können.

Return Time Objective (RTO) – von zwei Stunden auf Sekunden reduzieren

Dieser Vorgang kann mitunter menschliche Eingriffe erfordern und viele Stunden beanspruchen. Diese Zeit wird Return Time Objective (RTO) genannt. Regulatoren und Kunden legen diese Zeit üblicherweise auf zwei Stunden fest. Bereits vor einigen Jahren stellte SIA fest, dass ein solches Service Level in einer Zeit mit tausenden digitalen und speziell Instant Payments pro Sekunde nicht mehr passend sein würde. Die Vision: Notfallwiederherstellungs-Infrastruktur übertreffen und statt “Active-Passive”-Architektur eine “Active-Active”-Architektur weiterzuentwickeln, die dazu fähig ist, die RTO von Stunden auf Sekunden oder höchstens Minuten zu reduzieren.

Autor Fabio Grignani, SIA

Fabio Grignani, Senior Vice President und COO SIA<q>SIA</q>

Fabio Grignani ist Senior Vice President und Chief Operating Officer bei SIA. Grignani ist bereits seit 2007 bei SIA tätig und verantwortete seitdem unterschiedliche Positionen im Unternehmen. Zusätzlich zu seiner Tätigkeit als Senior Vice President und Chief Operating Officer ist er Vorstandsmitglied bei den SIA-Tochtergesellschaften SIA Central Europe, Budapest, sowie P4cards. Grignani ist zudem verantwortlich für die Leitung des Active-Active-Projektes, sowie die Steuerung des dazugehörigen Teams. Vor seiner Tätigkeit bei SIA sammelte Grignani umfangreiche Erfahrungen bei Accenture und RAS (Allianz Gruppe).

Dafür wurden neue Plattformen, die parallel laufen und Transaktionen in verschiedenen Rechenzentren verarbeiten, implementiert. Diese Rechenzentren liegen an unterschiedlichen physischen Standorten. Viele Kilometer voneinander entfernt. Diese sind im Fall einer Störung, die einen gesamten Standort betrifft, und auch gegenüber ernsthaften Geräte-, Netzwerk-, Hardware- oder Softwareschäden widerstandsfähig. Beide Standorte sind immer aktiv und automatische Verfahren garantieren den Wechsel der Verarbeitung von einem Standort zum anderen, ganz ohne menschliches Eingreifen.

Projekt-Phase 1

Die erste Phase des Projektes dauerte mehr als zwei Jahre und deckte hauptsächlich Mainframe und fehlertolerante Plattformen ab, über die Front-End- und Back-End-Kartenverarbeitungsprozesse laufen. 2016 wurde die zweite Phase des Projekts gelauncht, die darauf ausgerichtet war, die Active-Active-Architektur auf andere Plattformen auszuweiten, die auf Open Systems basieren. Der Projektansatz ist der gleiche wie in der ersten Phase: Wir haben die erfolgskritischen Dienstleistungen ausgewählt, die für die Active-Active-Architektur geeignet sind. Dann begannen wir die zugrundeliegende Infrastruktur zu erstellen. Zum Ende des Jahres werden die Dienstleistungen, die auf Open Systems-Plattformen laufen, im Active-Active-Modus nutzbar sein.

Herausforderungen bewältigen, um die Performance der Infrastrukturen und die Erbringung der Dienstleistungen zu sichern. Als das Projekt im Jahr 2013 startete, haben wir unsere Idee den wichtigsten Technologieanbietern vorgestellt und nach Unterstützung bei der Machbarkeitsstudie gefragt.

Diese reagierten zuerst skeptisch, da sie die Entfernung zwischen den zwei Rechenzentren für zu groß hielten.”

Eine clevere RZ-Infrastruktur sieht von außen auch nicht anders aus.SIA

Dadurch würde sich die Netzwerklatenz und damit die Antwortzeit unserer Transaktionen so vergrößern, dass es unmöglich sei, das angestrebte Serviceniveau, das mit unseren Kunden vereinbart ist, zu erfüllen. Nichtsdestotrotz beschlossen wir, auf dem Markt nach neuen Hochleistungslösungen zu suchen, um unser Ziel zu erreichen. Nach gründlicher Evaluierung wurden innovative Netzwerk-, Speicher- und Serverprodukte ausgewählt, welche in unseren Laboren mit Unterstützung der Anbieter validiert wurden. Diese Validierung wurde 2014 durchgeführt und ging mit einer tiefergehenden Überprüfung unserer Applikationen einher. Nach der erfolgreichen Validierungs- und Tuningphase wurden die neuen Plattformen im Jahr 2015 in der Produktion eingesetzt. Die größte Herausforderung war es, den 24/7 Transaktionsservice, welcher das sehr hohe Volumen an Transaktionen abwickelt, von den alten auf die neuen Plattformen im Concurrent Mode zu migrieren.

Concurrent Mode heißt: ohne jegliche Unterbrechung der Dienstleistungen. Und das ist uns gelungen.”

Bevorstehende Herausforderungen

Mit dieser Initiative haben wir den Marktbedarf für stringentere Service Levels bei der Geschäftskontinuität vorausgesehen. Denn wir glauben, dass es in einer zunehmend digitalisierten Welt, in der die Anzahl der Instant Payments steigt, immer wichtiger wird, diese Service Levels vorzuhalten. Denn künftig werden sie sich zu einem „Standard“ entwickeln. Wir haben seit jeher den Anspruch an uns, unseren Kunden hochqualitative und sichere Dienstleistungen zu bieten. Dies erfordert die Fähigkeit, sehr hohe Resilienz und Geschäftskontinuität zu gewährleisten. Die Active-Active-Architektur ist dafür eine ausgezeichnete Lösung. Je anspruchsvoller der Markt in Bezug auf Zuverlässigkeit und Sicherheit wird, desto mehr wird SIA die Active-Active-Architektur in seinen zukünftigen Dienstleistungen anwenden.aj

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert