Der Begriff Erkennung von Out-of-Distribution-Daten ist vor allem in den Bereichen Künstliche Intelligenz, Big Data und Smart Data sowie Cyberkriminalität und Cybersecurity zu Hause.
Mit Out-of-Distribution-Daten sind Informationen gemeint, die sozusagen „außerhalb des Gewohnten“ liegen – sie unterscheiden sich stark von den Daten, auf denen ein KI-System oder ein anderes datengetriebenes System trainiert wurde. Die Erkennung von Out-of-Distribution-Daten bedeutet daher, dass das System automatisch erkennt, wenn es auf unbekannte oder unerwartete Daten trifft.
Warum ist das wichtig? Viele Anwendungen, zum Beispiel bei der Bilderkennung, dem autonomen Fahren oder in der IT-Sicherheit, verlassen sich auf Modelle, die aus der Vergangenheit gelernt haben. Tauchen aber plötzlich ganz andere, nie gesehene Daten auf, kann das zu Fehlern oder sogar zu Sicherheitslücken führen.
Ein Beispiel: Ein auf Katzen und Hunde trainiertes KI-System bekommt plötzlich ein Bild von einem Elefanten. Dank der Erkennung von Out-of-Distribution-Daten merkt das System: „Achtung, das ist kein Hund und keine Katze – ich sollte lieber keinen Fehler machen!“ So helfen solche Systeme dabei, Risiken und unvorhersehbare Folgen zu vermeiden.