STRATEGIE10. Oktober 2023

Informationen intelligent extrahieren: vom Dokumenten­chaos zur strukturierten Datenanalyse

Marco Meisen, Geschäftsführer & CTO, und Sebastian Steinfort, Head of Data & Analytics, bei Actineo will Informationen aus Versicherer-Kernsystemen heben
Marco Meisen, Geschäftsführer & CTO, und Sebastian Steinfort, Head of Data & Analytics, bei ActineoActineo

In der Ver­si­che­rungs­bran­che wer­den aus­schei­den­de Mit­ar­bei­ten­de mit Jahr­zehn­te lan­ger Er­fah­rung in der Scha­dens­re­gu­lie­rung bald ei­ne klaf­fen­de Lü­cke hin­ter­las­sen. Ihr Wis­sen ist zwar im­pli­zit in den haus­ei­ge­nen Sys­te­men ge­si­chert, geht aber trotz­dem ver­lo­ren, weil Men­to­ren für jün­ge­re Kol­legen feh­len. Die gu­te Nach­richt: In den IT-Sys­te­men der Ver­si­che­rer schlum­mern enor­me Wis­sens­schät­ze in Form von Da­ten. Sie müs­sen nur ge­bor­gen wer­den, um Schä­den wei­ter­hin mit ge­ne­ra­ti­ons­über­grei­fen­dem Know-how re­gu­lie­ren zu können.

von Marco Meisen, Geschäftsführer & CTO, und Sebastian Steinfort, Head of Data & Analytics, bei Actineo

Sebastian Steinfort, Head of Data & Analytics, bei Actineo will Informationen aus Versicherer-Kernsystemen heben
Sebastian Steinfort, Head of Data & Analytics, bei ActineoActineo
Mittels Machine Learning und automatisierten Prozessen helfen KI-gestützte Tools heute schon bei der automatisierten Verarbeitung von Dokumenten und machen deren Daten nutzbar, so auch in der Schaden- und Leistungsregulierung von Versicherungen.

Einfach für den Menschen, eine Challenge für die Maschine

Egal ob Klinikbericht, Leistungsrechnung zu Mensch oder Tier, Anwaltsschreiben, Handwerkerrechnung oder Werkstattreport – grundsätzlich können Anwender mithilfe einer digitalen Anwendung jede Art von Dokument in unbegrenztem Umfang digitalisieren, strukturieren und handhabbar machen. Mittels Optical Character Recognition und Machine-Learning-Modellen liest ein solches Tool komplexe (medizinische) Akten, zerlegt diese in die einzelnen Komponenten, strukturiert Dokumente, klassifiziert diese und eliminiert Dubletten. In einem Folgeschritt werden relevante Daten wie Stammdaten, Diagnosen, Behandlungsempfehlungen oder Dauerschadeneinschätzungen aus den Dokumenten ausgelesen.

Was für einen Menschen einfach erscheint – vergisst man bei der Betrachtung die jahrelange Schul-, Aus- und Weiterbildung –, ist für eine Maschine immer noch eine schwierige Aufgabe. Um strukturiert die richtigen Informationen aus einem Dokument zu extrahieren, bedarf es mehrerer Schritte. Ein Modell muss in der Lage sein, das Layout des Dokuments zu erkennen und daraus Beziehungen zwischen Informationen abzuleiten, um wichtige Passagen oder relevante Stichworte extrahieren zu können. Ein solches Modell kann nur bis zu einem gewissen Grad generalistisch trainiert werden, da sich Strukturen von Dokumenten länderspezifisch unterscheiden. Es ist selbst für eine fachlich erfahrene Person schwierig, Dokumente aus einem anderen Kulturkreis zu verstehen.

Autor Sebastian Steinfort, Actineo
Sebastian Steinfort, Actineo Actineo

Sebastian Steinfort ist Di­plom-In­for­ma­ti­ker und Wirt­schafts­psy­cho­lo­ge (M.Sc.). Nach sei­nem In­for­ma­tik­stu­di­um an der Uni­ver­si­tät Dort­mund ar­bei­te­te er zu­nächst als C# .Net-Ent­wick­ler bei ver­schie­de­nen Un­ter­neh­men. Bei der AU­TO­on­line stieg Se­bas­ti­an Stein­fort vom Pro­duct Ow­ner zum Busi­ness De­ve­lop­ment Ma­na­ger mit dem Schwer­punkt Pro­dukt­ent­wick­lung aus Da­ten auf. Bei der Au­da­tex AU­TO­on­line be­stimm­te er – zu­letzt als Pro­dukt Ma­na­ger – den Er­folg des auf in­te­grier­tes Kfz-Scha­den­ma­nage­ment aus­ge­rich­te­ten Dienst­leis­ters mit. Be­vor er zu Ac­ti­neo (Web­site) wech­sel­te, hat­te Se­bas­ti­an Stein­fort bei Con­tro­l­Ex­pert schlie­ß­lich die Team­lei­tung Busi­ness In­tel­li­gence in­ne. Bei Ac­ti­neo ver­ant­wor­tet er die Ent­wick­lung von di­gi­ta­len Pro­duk­ten für die Per­so­nen­scha­dens­re­gu­lie­rung, die auf Prä­di­ka­ti­ons­mo­del­len, De­ep Learning, und Künst­li­cher In­tel­li­genz beruhen.

Für die erfolgreiche Extraktion der richtigen Daten ist eine Kaskade an unterschiedlichen Modellen beteiligt. Am Anfang steht die Bestimmung, ob in der zu verarbeiteten Datei mehr als ein Dokument enthalten ist.

Durch Bestimmung der Dokumentenart werden zusammenhängende Dokumente erkannt und entsprechend unterteilt. Durch diese Unterteilung ergibt sich der Kontext der Extraktion, ohne den die gefundene Informationen ohne Wert wären, da ihr Zusammenhang im Prozess unbekannt bliebe.”

Einfache Daten, wie Namen oder Datumsangaben können mit einfacher Validierung übernommen werden. Andere Informationen müssen weiterverarbeitet werden, zum Beispiel eine Anamnese oder ein Befund aus einem Arztbrief, da die enthaltenen Diagnosen und deren medizinische Kodierung nach ICD-10 von Interesse sind.

Use Cases aus allen Bereichen des Versicherungsgeschäftes

Die Visualisierung, die automatische Validierung und der manuelle Abschluss findet nach Regelwerken statt, die gemeinsam mit dem jeweiligen Versicherungskunden konfiguriert werden. Die Anwendungsfälle müssen dabei nicht zwangsläufig aus dem Schadensbereich kommen. Es sind auch Use Cases aus allen anderen Bereichen des Versicherungsgeschäftes denkbar. Die Daten stehen anschließend visuell in den Schadensystemen des Dienstleisters oder in anderen (Web-)Applikationen zur Verfügung.

Ebenso wie die Machine-Learning-Modelle in der Lage sein müssen, in unterschiedlichen Dokumentenarten andere Stichworte und ihre Bezüge zu finden, so muss die Applikation in der Lage sein, diese entsprechend ihrem Datenformat anzuzeigen und zu validieren.

Durch die Klassifikation der Dokumente ist bekannt, welche Informationen aus dem Dokument extrahiert werden müssen, und welches Datenformat erwartet wird. Die Anwendung selbst muss dann dynamisch zum Dokumententyp die Darstellung anpassen und entsprechende Validierung der gefundenen Daten vornehmen, sodass einem Mitarbeitenden erleichtert wird, zu erkennen, an welcher Stelle Unsicherheiten bei den gefundenen Daten oder Fehler vorliegen, falls eine Validierung fehlschlägt oder mehr als ein Treffer gefunden wurde.

Kundenschnittstellen flexibel anbinden

Lange Zeit führten vor allem Limitierungen auf Kundenseite dazu, dass die einzige Repräsentation der extrahierten Schadendaten eine Zusammenfassung in Form eines PDF-Dokuments war. Die Möglichkeit, Informationen in den Bestandssystemen auch auf andere Arten zu verarbeiten, besteht erst seit Kurzem. Diese Entwicklung ist zu begrüßen, da Kunden so besser datenbasiert unterstützt und Daten ohne Doppeleingaben seitens der Versicherungssachbearbeitenden direkt in den Systemen verarbeitet werden können.

Der Intelligent Document Navigator (IDN)

Daraus entstehen allerdings auch neue Herausforderungen. Unterschiedliche Kundenanforderungen bedeuten nicht mehr nur visuelle Änderungen in einem PDF-Dokument. Als Übertragungswege wird es ferner neben der GDV-Schnittstelle verschiedenste API-Anbindungen in die Backends der versicherungseigenen Systeme geben, um dort dieselben Informationen in einem Format und einer Struktur zu übertragen, die nach Kunde, Sparte oder sogar Abteilung unterschiedlich sein können.

Jeder Fachbereich wird seinen eigenen Schwerpunkt bei den zu extrahierenden Daten haben, um seine Arbeit effizienter zu gestalten.”

Autor Marco Meisen, Actineo
MarcoMaisen, Actineo Actineo

Marco Meisen, diplomierter Kaufmann und Wirtschaftsinformatiker, ist seit Januar 2021 als Geschäftsführer (CTO) ein Teil des Managementteams bei Actineo (Website). Er hat viel Erfahrung in agilen Softwareorganisationen und blickt auf mehr als fünfzehn Jahren Führungserfahrung zurück. 2010 wurde Meisen Head of Engineering und Agile Coach bei d.velop, einem führenden Anbieter von Enterprise-Content-Management-Systemen. Von 2013 bis 2017 war er Teamleiter beim Technologieberatungsunternehmen Cassini Consulting. Zuletzt agierte Marco Meisen als Chief Technology Officer bei Chefkoch, einem Gruner+Jahr-Webportal und Europas größter Food-Plattform.

Um dieser Entwicklung zu begegnen, sollte die Plattform ein flexibles Schnittstellenmanagement in Kombination mit einer Komponente zur Datentransformation bieten. So können Kundenschnittstellen flexibel angebunden und unabhängig davon die Daten in die geforderte Form transformiert werden. Das heißt konkret, der Versicherer könnte beispielsweise die Übermittlung per GDV, API oder SFTP-Upload wünschen und die eigentlichen Daten könnten in Formaten wie JSON, XML, Excel oder CSV übermittelt werden. Dabei spielt es keine Rolle, ob die Daten binär, Base64 oder anderweitig enkodiert werden müssten. Durch diese unabhängige Kopplung wird die maximale Integration in bestehende, aber auch künftige Systeme erreicht, um bei Bedarf alle Daten im eigenen Bestandssystem weiterverarbeiten zu können.

Wissenstransfer integrieren: ein Muss

Schadensdienstleister können Versicherungen datenbasiert sowohl in der Bearbeitung von laufenden Schadensfällen als auch in der Analyse historischer Datenbestände unterstützen. Damit ist es heute schon möglich, dem Sachbearbeiter auf Basis der Falldaten automatisiert Vorschläge zu machen, wie der Schaden reguliert werden kann. Künftig sollten auch hauseigene historische Daten integriert werden, um den Wissenstransfer implizit zu integrieren und den Effekten des drohenden Mitarbeiterschwunds entgegenzuwirken.Marco Meisen und Sebastian Steinfort, Actineo

Document Navigator (IDN)
Document Navigator (IDN) von Actineo nutzt KI für die automatisierte Verarbeitung von Dokumenten in der Schaden- und Leistungsregulierung von Versicherungskunden. Das Tool klassifiziert und sortiert (on- oder off-premise) eingehende Dokumente, extrahiert in Abhängigkeit vom definierten Anwendungsfall relevante Informationen aus jedem beliebigen Dateiformat, strukturiert diese und stellt sie validiert für beliebige Endformate und Schnittstellen zur Verfügung. Kurz: Versicherungskunden erhalten mithilfe der Machine Learning-gestützten Anwendung Dokumente und Daten für die End-to-End-Digitalisierung ihrer Schadenregulierung.

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert