Anzeige
STRATEGIE19. März 2020

Machine Learning & Big Data helfen – was wir aus den Finanzbetrügereien via N26 lernen können

Machine Learning (ML) und Big Data vereiteln Finanzbetrug - sagt Jan Kunigk, CTO EMEA bei Cloudera
Jan Kunigk, CTO EMEA bei ClouderaCloudera

Manchmal ist der Kunde doch ein unbekanntes Wesen. Das haben wohl die Manager bei der NeoBank N26 gemerkt, als die Finanzaufsicht BaFin im letzten Jahr eine Rüge wegen Mängeln bei der Bekämpfung von Geldwäsche und Terrorfinanzierung ausgesprochen hat und eine zügige Umsetzung von Maßnahmen anmahnte. Eine der Konsequenzen daraus war, dass der Kundenstamm neu identifiziert werden musste. Außerdem sollte das Internet-Finanzinstitut sein Personal von 1000 auf 1500 Mitarbeiter erhöhen. Diese Personalstärke hält die Bafin für erforderlich, damit N26 eine wirksame Geldwäschekontrolle durchführen kann. Doch auch Machine Learning würde helfen.

von Jan Kunigk, CTO EMEA bei Cloudera

Einfach nur mehr Personal wird vermutlich nicht ausreichen, um Geldwäsche und Terrorfinanzierung wirklich auf die Schliche zu kommen.

Der massiven Ausweitung der Finanzkriminalität und Geldwäsche lässt nur mit modernen Methoden aus der Informationstechnologie – wie beispielsweise Echtzeitanalyse und Machine Learning entgegentreten.”

Struktur und Ausbreitung von Finanzkriminalität

Aktuelle Studien taxieren den Verlust pro Jahr durch Finanzkriminalität auf 1,3 Billionen Euro. Nur 1 Prozent der entwendeten Gelder werden durch Strafverfolgungsbehörden wieder zurückgeführt. Angesichts solcher Zahlen wird schnell klar, dass niemand Kosten und Mühen bei der Bekämpfung von Finanzkriminalität scheuen sollte. Dem gegenüber steht jedoch in jedem Fall eine immer weiter wachsende Versiertheit der Kriminellen, wie sich am Beispiel der Geldwäsche zeigt:

Die Geldwäsche, deren Schaden weltweit auf über 230 Milliarden Euro jährlich taxiert wird, wird von den Akteuren in drei Phasen vollzogen: Einspeisung, Verschleierung und Integration. Bei der Einspeisung, auch als Smurfing bekannt, werden durch Straftaten erlangte Bargeldmengen in meist kleineren Teilbeträgen in den Finanzkreislauf eingeschleust.

Bei der Verschleierung werden die Spuren zur Herkunft des Geldes verwischt, indem die Summen so oft von einem Konto auf ein anderes überwiesen werden, bis die Nachweisbarkeit nicht mehr gegeben ist.”

So können Geldbeträge aufgrund von Scheingeschäften mittels Offshore-Banken, Scheingesellschaften oder Strohmännern einen legitimen Anstrich erhalten.

Autor Jan Kunigk, CTO EMEA bei Cloudera
Jan Kunigk ist bei Cloudera (Website) als Field CTO EMEA tätig. Am Anfang seiner Karriere widmete er sich bei IBM ab 2005 zunächst dem Thema Distributed Systems und leitete 2013 bei T-Systems die Einführung von Hadoop Hosting Services. Seit 2014 arbeitet Kunigk bei Cloudera. Bevor er von Cloudera zum Field Chief Technology Officer für die EMEA-Region ernannt wurde, unterstützte er zunächst die Kunden des Unternehmens als Solutions Architect bei großen Data-Processing-Projekten.
In der dritten Phase, der Integration wird das gewaschene Geld nun für legale Operationen wie etwa den Erwerb von Immobilien oder Firmenanteilen genutzt.

Für das Smurfing und die Verschleierung bedienen sich die Kriminellen oft sogenannter Money Mules, also Individuen die wissentlich oder unwissentlich in „Heimarbeit“-Arrangements rekrutiert werden. Die Rekrutierung und die in der Folge erteilten Anweisungen erfolgen standardisiert, teilweise automatisiert und sind dadurch skalierbar.

Im besagten Beispiel von N26 köderten vermeintliche Marktforschungsunternehmen Verbraucher, um ein Bankkonto zu eröffnen, in dem Glauben, Testkunde zu sein.”

Moderne Ansätze für die Bekämpfung von Finanzkriminalität

Die Anordnung der Bafin an N26 verlangt dazu den Aufbau einer adäquaten Personaldecke einerseits – im konkreten Fall fünfhundert zusätzliche Sachbearbeiter – sowie entsprechende technische Ausstattung. Diese können jedoch nicht ausschließen, dass sich Kriminelle eines Geldinstituts bedienen. Data Scientists und Industrieexperten sind sich jedoch einig, dass Machine Learning und Artificial Intelligence die Schlüssel zur automatischen Entdeckung von Geldwäscheprozessen sind.”

Um Machine Learning erfolgreich anzuwenden, bedarf es einer Zusammenführung und Vereinheitlichung der immer noch vorherrschenden üblichen Datensilos – Stichwort Data Lake.”

Aber wie kann über alle Ebenen im Data Lake Security und Governance vereinheitlicht werden? Wie kann ein Unternehmen eben diese Standards im eigenen Datacenter und in der Cloud harmonisieren? Immer mehr Akteure in der Industrie beantworten diese Frage anhand einer neuen Kategorie, der Enterprise Data Cloud. Diese dient als standardisierte Blaupause zur Vereinheitlichung von Hybrid- und Multi-Cloud-Architektur und erlaubt den gesamten Data Lifecycle abzubilden von der Quelle bis zum Machine-Learning-Modell abzubilden.

Das Aggregieren mehrerer Datenquellen erlaubt es sukzessive, eine 360-Grad-Sicht über Netzwerke von Akteuren in verdächtigen Transaktionen zu etablieren. Für Personen, die mit den Daten arbeiten, etwa Business-Analysten oder Data Scientists, ist es wichtig, die richtigen Tools innerhalb dieser sicheren und kontrollierten Plattform zu nutzen. So ermöglicht die Enterprise Data Cloud beispielsweise durch schnelle Inbetriebnahme eines integrierten Data Marts auf Basis von Container-Technologie sichere Workflows für die Analyse und Abfrage von Daten aus der Quelle mit vertrauten Schnittstellen, Abfragesprachen und skalierbarer Rechenleistung, unabhängig davon, ob es auf einem Kubernetes Cluster im eigenen Datacenter oder auf den Kubernetes Services der einschlägigen Cloud-Dienstleister stattfindet.

Oft bilden regelbasierte Systeme zur Detektion von Finanzkriminalität den Stand der Technik. Diese liefern aber nach wie vor häufig Fehlalarme und sind nur schwer anpassbar.”

Lernende Algorithmen, also Machine-Learning-Modelle, finden im Gegenzug selbständig neue Muster und können sich bis zu einem gewissen Grad und je nach Algorithmus an neue Methoden zur Vermeidung der Entdeckung anpassen.

Für die Geldwäschebekämpfung sind verschiedene Methoden aus dem Machine Learning wie Clustering oder Support Vector Machines bis hin zu Deep-Learning-Methoden wie tiefe neuronale Netze relevant.”

Alle diese Modelle funktionieren umso besser, je mehr Daten ihnen zur Verfügung stehen, um sie zu trainieren, was wiederum eine massiv skalierbare Umgebung über normale Datawarehouse-Grenzen hinaus erfordert. Diese Trainingsphase ist überdies enorm rechenintensiv und benötigt oft zwingend Hardware-Beschleuniger basierend auf GPU-Technologie.

Da eine solche Infrastruktur teuer ist, bietet sich Cloud Bursting an, bei dem auf Kampagnen-Basis und vollautomatisiert eine Machine-Learning-Umgebung bei gängigen Anbietern von Public-Cloud Infrastruktur genutzt wird. Diese wiederum bieten allesamt die erwähnten Hardware-Beschleuniger & GPU-Instanzen. Die Enterprise Data Cloud Architektur ermöglicht hier wiederum, zwischen mehreren Cloud-Anbietern auswählen zu können.

Unabhängig ob in der Cloud oder On-Premises, einheitliches Tooling für Machine Learning erleichtert Data Scientists die Entwickelung und das Testen von Deep-Learning- und Machine-Learning-Algorithmen. Dabei sollte darauf geachtet werden, dass eine hochgradig individualisierbare und kollaborative Projektumgebung in vertrauten Sprachen wie R, Scala oder Python vorhanden ist. Ebenfalls wäre eine volle Integration in die jeweils präferierte Entwicklungsumgebung wie Jupyter Notebooks oder RStudio nützlich.

Trainierte Modelle können zur Laufzeit sowohl gegen Daten im Data Warehouse laufen, oder auf Basis von Apache Kafka, Apache NiFi und Apache Flink in Echtzeit auf Streaming Daten angewandt werden.”

Maschinen lernen helfen

Moderne Datenplattformen ermöglichen zusammen mit den verwendeten Tools Arbeitsabläufe wie maschinelles Lernen zur Muster- und Betrugserkennung. Sie gewähren einen sicheren Zugriff auf die Daten und eine elastische Berechnung der CPU- und GPU-Ressourcen. Data Scientists können durch die mitgelieferten Tools innerhalb des Systems schnell Modelle erstellen, die diese Muster in Echtzeit erkennen können. Die Modelle und alle Daten verbleiben zu jedem Zeitpunkt in der abgesicherten Enterprise Data Cloud, die ein komplettes End-to-End-Big-Data-System bildet und ineffiziente Punktlösungen vermeidet.

Für das Beispiel der Geldwäscheproblematik bedeutet dies, dass eine Bank verdächtige Kontobewegungen nicht mehr nur aufgrund vordefinierter Muster auf die Schliche kommen kann, sondern den Kriminellen nun einen Schritt voraus ist, wenn es darum geht, auch neue Methoden der Verschleierung illegaler Geldflüsse zu erkennen und diese wirksam von Anfang an zu unterbinden.Jan Kunigk, CTO Cloudera

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert