Blinde Flecken im Eventlog: Wie generative KI die Prozessvorhersage verbessert

Unvollständigkeit ist keine Ausnahme in der Data Science – sie ist die Regel. Unsere Daten hinken fast immer hinter den Signalen her, die wirklich zählen. In der Prozessanalyse führt diese Lücke zu blinden Flecken: Verhaltensmuster, die in unseren Eventlogs schlicht nicht repräsentiert sind. Genau dieses Problem wollten wir lösen. Unser Ansatz nutzt generative KI, um diese Lücken systematisch zu schließen und damit die Qualität des Predictive Process Monitoring zu verbessern.

Die Idee ist einfach, aber wirkungsvoll. Beim Predictive Process Monitoring trainieren wir Modelle auf Basis historischer Fälle – etwa 10.000 Rechnungsinstanzen –, um vorherzusagen, was beim nächsten Fall passiert. Welche Aktivität kommt als Nächstes? Wie lange dauert es von der Rechnungsstellung bis zum Zahlungseingang? Die Herausforderung besteht darin, dass der aktuelle Fall möglicherweise einer Variante angehört, die in den Trainingsdaten nie vorgekommen ist.

Hier kommen Large Language Models ins Spiel. Wir nutzen sie nicht als Vorhersagemodelle, sondern als informierte Kritiker der Daten selbst. Auf Basis ihres umfangreichen „Wissens“ darüber, wie Rechnungsprozesse funktionieren, bewerten LLMs die Trainingsdaten und identifizieren Muster und Verhaltensweisen, die plausiblerweise zu erwarten wären, aber fehlen. Diese Erkenntnisse werden anschließend genutzt, um die Daten gezielt zu ergänzen.
Die Ergebnisse sind überzeugend. Über mehrere reale Datensätze hinweg liefert unsere Methode signifikante Verbesserungen gegenüber dem Stand der Technik bei der Vorhersage der nächsten Aktivität im Predictive Business Process Monitoring.

Unser Paper „Improving next process activity prediction with scarce event log data using data augmentation with large language models“ wurde zur Veröffentlichung in Information Systems akzeptiert und ist als Open-Access-Version im Vorabdruck verfügbar.

Autoren: Martin Käppel, Sven Weinzierl, Lars Ackermann-Igl, Stefan Jablonski, Martin Matzner