Anzeige
STRATEGIE25. April 2016

Graphdatenbanken in der Finanzwelt: Mehr Transparenz durch Big Data Analysen

Holger Temme, Area Director CEMEA, Neo TechnologyNeo Technology
Holger Temme, Area Director CEMEA, Neo TechnologyNeo Technology

Der Umgang mit Daten verlangt in der Finanz­branche seit jeher ein hohes Maß an Vertrauen und Sicherheit. Das ändert sich auch mit Big Data nicht. Neu ist jedoch die Art wie Informationen aus unterschiedlichen Quellen erfasst, ausgewertet und genutzt werden können. Banken und Kredit­instituten, die es schaffen, echten Mehrwert aus den Daten zu ziehen und gleichzeitig sensible Daten sicher zu verwalten, biete sich damit viel Potenzial. Was das mit den Panama Papers zu tun hat, erläutert Holger Temme von Neo Technology.

von Holger Temme, Area Director CEMEA, Neo Technology 

Die Komplexität von Big Data beruht auf zwei wesentlichen Faktoren: Unstrukturiertheit und Verbundenheit der Daten. Viele Unternehmen, Banken und Versicherungen nutzen zur Auswertung nach wie vor relationale oder auch SQL-Datenbanken. Aufgrund des Online-Transaction-Processing (OLTP) lassen sich Transaktionen damit ohne nennenswerte Zeitverzögerung verarbeiten. Dazu ist die Modellierung in Tabellen und Spalten sowie durch komplexe (Selbst-)Verknüpfungen nötig. Beziehungen zwischen den Tabellen lassen sich nur über sogenannte Joins der Primär- und Fremdschlüssel-Tabelle berechnen. Will ein Finanzberater z. B. ein Gesamtbild eines Kunden erhalten, muss er mehrere Tabellen mit Informationen wie Name, Konten, laufende Kredite und Transaktionen miteinander verbinden.

Je komplexer der Datensatz jedoch wird, desto schneller stoßen diese herkömmlichen Lösungen an ihre Grenzen. Die Antwortzeiten wachsen rasant, Suchabfragen gestalten sich komplex, sind oft kostspielig und bringen das System oft eher ins Stocken, als verlässliche Antworten zu liefern.

Panama Papers: Bei 2,6 Terabyte an Daten sind einfache Suchabfragen und Visualisierungstools gefragt um komplexe Datenstrukturen verstehen zu können.Neo Technology
Panama Papers: Bei 2,6 Terabyte an Daten sind einfache Suchabfragen und Visualisierungstools gefragt, um komplexe Datenstrukturen verstehen zu können. Neo Technology

NoSQL – Neue Wege durch Big Data

Parallel zu Big Data wurden daher in den letzten Jahren neue Technologien entwickelt, bekannt unter dem sehr heterogenen Sammelbegriff NoSQL. Gemeinsam haben diese Datenbankmodelle nur ihre nicht-relationale Methodik. Man unterscheidet zwischen drei Hauptkategorien: dokumentenorientierte Datenbanken, Key-Value-Datenbanken und Graphdatenbanken.

Graphdatenbanken punkten vor allem durch ihre hohe Geschwindigkeit – eine Grundvoraussetzung, die u. a. im Aktienhandel eine wichtige Rolle spielt. Analysten müssen schnell auf fallende Kurse reagieren, empfehlen per Mausklick den Kauf und Verkauf von Wertpapieren und verfolgen in Echtzeit aktuelle Marktentwicklungen. Auch bei individuellen Services – vom E-Banking bis hin zu Beratungsportalen – verlangen Kunden schnelle Reaktionszeiten innerhalb weniger Millisekunden und einen zuverlässigen Zugriff auf relevante, stets aktuelle, oft sehr komplexe Daten.

In Graphdatenbanken hängt die Abfragegeschwindigkeit nicht länger von der Gesamtmenge oder den Verknüpfungsoperationen ab, sondern nur von der Anzahl der konkreten Beziehungen zwischen den einzelnen Daten. Dank der Struktur des Graphen, müssen diese nicht aufwändig berechnet werden, sondern lassen sich von einem beliebigen Punkt aus leicht nachverfolgen. Damit erzielen graphbasierte Systeme auch bei komplexen Suchabfragen Ergebnisse in Echtzeit.

Vorteil Graph: Komplexe Daten anschaulich darstellen

Masterdaten, Produkte, Kundeninformationen – die Menge an Daten in Unternehmen wird nicht nur größer, sondern auch immer komplexer.Neo Technology
Masterdaten, Produkte, Kundeninformationen – die Menge an Daten in Unternehmen wird nicht nur größer, sondern auch immer komplexer.Neo Technology

Die Beziehungen zwischen den Daten stehen bei Graphdatenbanken im Fokus. Selbst ein komplexes Netz an Informationen lässt sich innerhalb eines Graphen anschaulich darstellen – ein entscheidender Vorteil, wenn es z. B. um die Aufdeckung von Betrugsversuchen geht. Komplexe Transaktionssysteme von Banken bieten Betrügern eine ganze Bandbreite an Angriffsmöglichkeiten. Analysesysteme, die auf relationalen Datenbanken beruhen, sind meist nicht in der Lage, verdächtige Transaktionen aufzuspüren, die sich nach metrischen Kriterien völlig „normal“ verhalten. Graphdatenbanken hingegen erkennen nicht nur diskrete Daten, sondern auch verdächtige Muster und damit komplette Netzwerke von Betrügern. Finanzdienstleister können Körperschaften und Verknüpfungen eindeutig zuordnen und milliardenschwere Betrugsverluste z. B. durch First-Party-Fraud oder E-Commerce-Fraud in Echtzeit verhindern. Auch Online-Bezahlsysteme wie PayPal setzen schon seit Jahren auf Graphtechnologie, um Transaktionsnetzwerke in Echtzeit darzustellen und komplexe Beziehungen zwischen Käufern und Verkäufern nachzuverfolgen.

Die Anwendungsbereiche für graphbasierte Big Data Analysen sind dabei so vielseitig wie die im Finanzwesen angebotenen Services und Aufgabenfelder. Graphen unterstützen Analysten und Berater u. a. bei der Simulation von Vorhersagemodellen und der Kalkulation von Risiken, sichern sensible Daten über Identitäts- und Zugangsmanagementsysteme ab und ermöglichen nicht nur neue Systeme im Hochfrequenzhandel, sondern auch eine zuverlässige, umfassende Prüfung von Kunden bei der Kreditvergabe.

Graphtechnologie & Neo4j
Stammbäume, Mind-Maps oder das U-Bahn-Netz einer Stadt – Graphen werden meistens durch einzelne Kreise und verbindenden Linien dargestellt. Mit dieser einfachen Struktur können sie eine Menge von Objekten („Knoten“), die Beziehungen zwischen diesen Objekten („Kanten“) sowie deren Eigenschaften („Properties“) anschaulich abbilden. In Graphdatenbanken können die Daten in Form von Graphen gespeichert, verwaltet und abgefragt werden. Damit eignen sich diese Datenbanken besonders gut, um stark vernetzte und/oder unstrukturierte Informationen darzustellen. Neo4j gilt als Pionier innerhalb der Graph-Technologie und wird von Unternehmen auf der ganzen Welt eingesetzt – darunter Royal Bank of Scotland, WalMart, adidas, eBay, HP und Cisco. Zu den Anwendungsgebieten zählen neben der graphbasierten Suche, der Betrugserkennung und dem Identitäts- und Zugangsmanagement auch das Masterdatenmanagement, Telekommunikationsnetzwerke, Recommendation Systeme sowie soziale Netzwerke.

Netzwerkanalyse zur Ermittlung der Eigentumsverhältnisse

Die italienische Rating-Agentur Cerved nutzt Graphtechnologie z. B. zur Netzwerkanalyse. Das Unternehmen im Bereich Kreditrisikoanalyse betreut über 34.000 Kunden im Jahr und bearbeitet über 800 Terabyte an Daten aus einer Vielzahl unterschiedlicher Quellen. Eine besondere Rolle spielt dabei die Ermittlung des “real owners“ eines Unternehmens. Damit ist die Person gemeint, die direkt oder indirekt 25 % +1 der Kapitalanteile eines Unternehmens hält. Die Ermittlung des tatsächlichen Eigentümers wurde 2007 im Rahmen der Bekämpfung von Geldwäsche in die italienische Rechtsprechung eingeführt und  betrifft Institutionen weltweit, angefangen bei Unternehmen über Kreditinstitute bis hin zu staatlichen Behörden.

Für eine schnelle Suche und zur Erfüllung gesetzlicher Auflagen löste Cerved sein auf einer relationalen Datenbank basierendes System ab und führte eine neue, auf der Graphdatenbank Neo4j (siehe Kasten) gestützte Lösung ein. Die Mailänder Analysten konnten so das Serviceniveau um mindestens das Doppelte anheben: Die durchschnittliche Berechnungsdauer von Besitzverhältnissen mit bis zu 15 Verlinkungen reduzieren sich von 12 Sekunden auf gerade einmal 67 Millisekunden. Dadurch ließ sich nicht nur die Suche ausweiten, sondern auch der Algorithmus verbessern und damit das Vertrauen der Kunden in die von Cerved bereitgestellten Daten deutlich stärken.

Analyse der “Panama Papers”

Eine tragende Rolle spielte Graphtechnologie darüber hinaus bei der Entschlüsselung und Analyse der “Panama Papers” durch das Internationale Consortium of Investigative Journalists (ICIJ). Der gewaltige Daten-Leak mit rund 2,6 Terabyte an internen Dokumenten des Offshore-Dienstleisters Mossack Fonseca wurde mit Hilfe einer Grapdatenbank (Neo4j) sowie einer Visualisierungsplattform (Linkurious) entschlüsselt. Dabei wurden die stark verknüpften Daten so strukturiert, dass Journalisten einfach und schnell Verbindungen zwischen den Daten herstellen und so den Spuren des Geldes folgen konnten.

Ob bei der Aufdeckung von Betrugsversuchen, Online-Bezahldiensten, Kundenservices oder graphbasierten Rechercheabfragen – NoSQL-Systeme wie Graphdatenbanken nehmen für sich nicht in Anspruch, bestehende relationale Architekturen zu ersetzen. Vielmehr geht der Trend zu einem hybriden oder polyglotten Ansatz, bei dem mehrere unterschiedliche Systeme eingesetzt werden, die unterschiedliche Vorteile bieten. Als Ergänzung zu bestehenden Systemen eröffnet Graphtechnologie so einen völlig neuen Umgang mit Big Data und erlaubt es, die wachsende Menge an Daten sinnvoll auszuwerten und effektiv zu nutzen.aj

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert