Forschende der ZHAW School of Engineering (Zürcher Hochschule für Angewandte Wissenschaften) haben ein innovatives Framework entwickelt, das Anomalien und Defekte in Maschinen effizienter erkennt, selbst wenn Trainingsdaten verunreinigt sind. Diese Entwicklung geht auf eine zentrale Herausforderung in der KI-Forschung ein: eine präzise Fehlererkennung, ohne auf fehlerfreie Trainingsdaten zurückgreifen zu können.
Hintergrund dazu ist, dass die Erkennung ungewöhnlicher oder anormaler Muster in industriellen Daten eine der häufigsten Aufgaben von KI-Algorithmen in kommerziellen Anwendungen ist. Sie ermöglicht die frühzeitige Erkennung von Degradation, Defekten und Fehlern in der Produktion und erlaubt es, diese Probleme rechtzeitig zu beheben und so Kosten zu sparen und Ausfallzeiten zu reduzieren.
Anomalieerkennung in Maschinen basiert in der Regel auf "Lernen aus der Normalität". Das bedeutet, dass KI-Algorithmen anhand von Daten aus einwandfrei funktionierenden Maschinen trainiert werden, um später Abweichungen in Betriebsdaten zu erkennen. In der Praxis stehen laut den ZHAW-Forschern jedoch häufig keine vollständig fehlerfreien Daten zur Verfügung, was die Effektivität der Modelle erheblich beeinträchtigt. Das Training mit kontaminierten Daten führe dazu, dass die Modelle nicht mehr zwischen normalen und fehlerhaften Betriebsbedingungen unterscheiden könnten – eine Herausforderung, die
"Durch die Zusammenarbeit mit verschiedenen Unternehmen haben wir realisiert, dass es einen Bedarf an KI-Algorithmen gibt, die direkt und ohne vorherige menschliche Eingriffe für die Datenbeschriftung eingesetzt werden können", erklärt Lilach Goren Huber vom Smart Maintenance Team am ZHAW Institut für Datenanalyse und Prozessdesign (IDP).
Um diese Lücke zu schliessen, haben die ZHAW-Forschenden ein neuartiges Framework entwickelt, das historische, potenziell kontaminierte Daten automatisch auswertet und normal funktionierende Datenproben vollständig unüberwacht extrahiert. Auf diese Weise können die bereinigten Daten für das Training von Anomalieerkennungsalgorithmen genutzt werden, ohne dass eine aufwendige manuelle Sortierung nötig ist.
Das Framework basiere auf einer zentralen Beobachtung: Fehlerhafte Datenproben haben einen stärkeren Einfluss auf die Leistung der KI-Modelle als normale Proben. Basierend auf diesem Prinzip wird jeder Datenprobe ein Score zugewiesen, der ihren Einfluss auf das Training misst. Proben mit einem hohen Score werden als potenziell fehlerhaft identifiziert und aus den Trainingsdaten entfernt. In Tests erzielte das Framework mit diesen verfeinerten Daten eine vergleichbare Leistung wie manuell bereinigte Datensätze, lassen die Experte wissen.
Die ZHAW hat die Methode den Angaben zufolge an einer Vielzahl von Maschinentypen getestet, darunter Pumpen, Ventile, Ventilatoren und Triebwerke, und dabei vielversprechende Ergebnisse erzielt. In den meisten Fällen konnte das Framework den Mangel an fehlerfreien Trainingsdaten vollständig kompensieren. "Unser Ansatz ist nicht nur einfach und robust, sondern auch universell einsetzbar. Er kann mit beliebigen Datentypen und bestehenden Fehlererkennungsmethoden kombiniert werden", lässt Lilach Goren Huber dazu wissen.