Anzeige
STRATEGIE15. April 2021

Künstliche Intelligenz wird unterschätzt: Neueste Entwicklungen in den Bereichen OCR und NLP

Experte für OCR und NLP: Christophe Bourguignat
Christophe Bourguignat, Chief Executive Officer und Co-Founder von Zelros Zelros

Gerade im Bereich Data Analytics entwickelt sich die Digitalisierung in der Versicherungsbranche zu einem Feld mit interessanten Möglichkeiten. Denn viele Prozesse erfordern noch immer massive manuelle Bearbeitung und sind deshalb nicht sehr effizient. Mit den aktuellen Entwicklungen in den Bereichen Computer Vision und Voice Analytics wird die Automatisierung bei gleichzeitiger Individualisierung einen neuen Schub erleben. Selbst im persönlichen Beratungsgespräch führt eine KI schneller zu besseren Ergebnissen.

von Christophe Bourguignat, CEO Zelros

Optical Character Recognition (OCR) – eine Technologie aus dem Bereich der Computer Vision – leistet in vielen Versicherungsunternehmen bereits gute Dienste bei der teilautomatisierten Erfassung von Dokumenten. OCR-Systeme erkennen gedruckte oder handgeschriebene Schriftzeichen in digitalisierten Dokumenten und speisen sie automatisch in die jeweiligen nachgelagerten Systeme, die diese Daten dann verarbeiten. Nun bestehen Dokumente, die bei Versicherungen verarbeitet werden, aber nicht ausschließlich aus Text. Aktuelle Machine-Learning-Projekte (ML) ergänzen die bewährten OCR-Verfahren.

Über OCR hinaus

Ein typischer Bestandteil von Formularen sind beispielsweise Checkboxen. Im Prinzip muss das System nur erkennen, ob eine Checkbox markiert ist oder nicht. Praktisch erweist sich das für eine Maschine als gar nicht so trivial: Zunächst müssen die Checkboxen als solche erkannt werden – das können OCR-Algorithmen bereits leisten, indem man sie nutzt, um das Dokument in seine verschiedenen Textbereiche zu zergliedern. Dann aber müsste der Algorithmus die Pixel jeder Checkbox analysieren, um zu prüfen, ob es abgehakt ist oder nicht. Das ist zeitaufwändig und wenig skalierbar. Inzwischen gibt es Tools auf dem Markt, die diese Herausforderung effektiv mittels einer Multi-Label-Klassifizierung lösen. Dabei wird der Checkboxen-Bereich als Ganzes und wie ein Image betrachtet, wobei jede Checkbox einer Klassenbezeichnung entspricht. Durch Training schafft es der Algorithmus, wie bei der Identifikation von gelabelten Bildern, zu erkennen, welche Klasse zutreffend – also welche Checkbox markiert – ist.

Dass OCR Dokumente in Einzelbereiche zerlegen kann, ermöglicht die Integration weiterer ML-basierter Analysen:

So können beispielsweise Unterschriften auf Dokumenten analysiert und mit den in der Datenbank registrierten Einträgen verglichen werden. Sektionen mit Zeichnungen, wie sie etwa bei Formularen zu Unfallhergängen üblich sind, können separiert und als Image nach entsprechenden Kriterien klassifiziert werden.”

Außerdem berechnen KI-Algorithmen im Hintergrund, ob die Zeichen in maschinell ausgefüllten Dokumenten möglicherweise per Software manipuliert worden sind. Dabei wird jedes Zeichen hinsichtlich seines Aussehens genau geprüft. Weichen Parameter wie etwa die Größe, die Ausrichtung oder die Linienführung vom Standard ab, weist das auf einen Betrugsversuch hin.

Entscheidender Paradigmenwechsel beim NLP

Über Zelros
Zelros ist ein internationales IT-Unternehmen mit Hauptsitz in Frankreich und Anbieter einer auf künstlicher Intelligenz basierenden B2B-Software speziell für Versicherungsunternehmen. Die Software-Lösung Zelros for Distribution trainiert sich durch maschinelles Lernen kontinuierlich selbst und ermöglicht es Versicherungsunternehmen, ihren Vertrieb und die Customer Journey zu verbessern. Durch Zelros können Versicherer eine nahtlose und personalisierte Kundenerlebnis anbieten. Dies umfasst den Abschluss von Versicherungsleistungen ebenso wie den Service für die Bestandskunden. Zelros’ Dienstleistungen werden von namhaften internationalen Versicherungsunternehmen eingesetzt, darunter Groupama, MAIF, La Banque Postale, Groupe BPCE, Assurone, +Simple. Weitere Informationen finden Sie auf der Webseite.

Neben der Dokumentenanalyse spielen ML-basierte Voice Analytics eine zunehmend wichtige Rolle im Beratungsalltag von Versicherungsvertretern: Ein Analyse-Tool erkennt wichtige Informationen aus Gesprächen und Telefonaten. Damit kann zum einen das CRM-System angereichert werden. Zum anderen kann der Algorithmus Einfluss auf die Beratung nehmen, indem er in Echtzeit kontextbezogene Empfehlungen gibt.

Solche Analyse-Systeme beruhen auf Natural Language Processing (NLP), welches Computer dazu befähigt, menschliche Sprache so zu verstehen, wie sie gesprochen bzw. geschrieben wird. Sprachassistenten, Smartspeaker und Chatbots zum Beispiel nutzen diese Technologie schon länger, um Such- oder andere Anfragen richtig zu interpretieren.”

Die meisten NLP-Algorithmen beruhen auf Wort-Vektoren: Jeder Text wird anhand seiner Worte mehrdimensional klassifiziert und so zu einem Vektor, der mit anderen Vektoren verglichen werden kann. Je näher zwei Vektoren einander sind (euklidische Distanz), umso inhaltlich ähnlicher sind sie sich wahrscheinlich.

Solche Embedded Words werden mit Hilfe von NLP-Algorithmen auf eine große Menge von ungelabelten Daten trainiert und zur Initialisierung der ersten Schicht eines neuralen Netzes genutzt. Die weiteren neuronalen Schichten werden dann auf eine spezielle Aufgabe hin trainiert. Dies führt zwar zu einer Steigerung der Erkennungsraten – allerdings in geringem Umfang, vor allem, wenn die Menge der Trainingsdaten begrenzt ist. Zudem bringen diese Modelle immer nur vorheriges Wissen in die erste neuronale Schicht ein, der Rest des neuronalen Netzes muss jedes Mal neu trainiert werden.

Transformer verzichten auf Rekurrenz-Analyse

Autor Christophe Bourguignat, Zelros
Christophe Bourguignat ist Chief Executive Officer und Co-Founder von Zelros. Er gründete das Unternehmen 2016 in Paris zusammen mit Fabien Vauchelles und Damien Philippon mit der Vision, ein auf die Versicherungsbranche spezialisiertes Software-Unternehmen aufzubauen. Sein Ziel ist es, die Digitalisierung in Versicherungsunternehmen voranzutreiben, deren Vertrieb sowie die Customer Journey zu optimieren. Christophe gründete zudem FrenchData im Jahr 2016, einen einflussreichen Think Tank zur Förderung der französischen Datenszene. Zuvor war er unter anderem bei der Versicherungsgruppe AXA als Big Data Lead tätig. Er besitzt eine rund 20-jährige Expertise im IT-Bereich, mit besonderem Fokus auf künstlicher Intelligenz, maschinellem Lernen, Cyber Security und Big-Data-Technologien. Christophe verfügt zudem über einen Master of Science in Ingenieurwissenschaften von der französischen Ingenieurschule CentraleSupelec.

Aktuelle NLP-Algorithmen führen sogenannte Transformer ein und erschaffen ein Pretrained Language Model. Dabei wird nun nicht mehr nur die erste Schicht der Modelle initialisiert, sondern das gesamte Modell mit allen hierarchischen Repräsentationen (Wissensabbildungen und -veränderungen) vortrainiert. Ein echter Paradigmenwechsel, denn nun werden die Informationen aus einem vortrainierten Sprachmodell auf die nachgelagerten, spezialisierten Aufgaben übertragen, sodass nur noch ein Feintuning mit den versicherungsspezifischen Daten notwendig ist. Diese Art des Machine Learnings wird als Transfer Learning bezeichnet.

Im Gegensatz zu den Vorgänger-NLP-Modellen analysieren Transformer nicht, wie oft sich sprachliche Formen innerhalb eines Textes wiederholen.

Vielmehr nutzen Sie eine „Multi-Head-Attention“-Funktion, mit der sie aus vorher gemerkten Informationen und der Vorgängerebene des neuronalen Netzes die Ausgabe berechnen. Damit ahmen sie die Aufmerksamkeit eines Lesers oder Zuhörers nach.”

Transformer erlauben die Nutzung leistungsstarker GPUs und damit die Berechnung großer Modelle mit größeren Datenmengen. Das bekannteste Projekt in diesem Bereich heißt BERT (Bidirectional Encoder Representations from Transformers), welches maßgeblich von Google vorangetrieben wurde und als der Grundstein dieser Art von Pretrained Language Models gilt.

Vorurteile gegenüber KI abbauen

Immer wieder sehen sich KI- und ML-Algorithmen Kritik ausgesetzt. Diese reicht von der Undurchschaubarkeit und damit Unberechenbarkeit der Algorithmen selbst bis hin zu Zweifeln an der Tauglichkeit der Trainingsdaten. Gerade in der Versicherungsbranche, wo es um sensible Daten und Entscheidungen geht, sind Vertrauen und Fairness sehr wichtige Komponenten. So sollten Versicherungsunternehmen beispielsweise ausschließlich nachvollziehbare Entscheidungs- und Profiling-Systeme einsetzen, um sogenannte Black-Box-Entscheidungen, bei denen die Entscheidungsgrundlagen unklar sind, zu vermeiden.

Anbieter und Unternehmen, die KI nutzen, sollten sich deshalb hohe ethische AI-Standards auferlegen und diese auch transparent kommunizieren.”

Christophe Bourguignat, Zelros

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert