Lernen mit verrauschten Labels gehört zur Künstlichen Intelligenz, Big Data und Smart Data sowie zur Digitalen Transformation. Es beschreibt eine Situation, bei der künstliche Intelligenz (KI) mit Daten trainiert wird, deren „Beschriftungen“ oder Zuordnungen nicht immer ganz korrekt sind.
Im Alltag kann dies zum Beispiel in einem Online-Shop passieren: Ein KI-System soll erkennen, ob Fotos Schuhe oder T-Shirts zeigen. Einige Bilder sind aber versehentlich falsch markiert – zum Beispiel wurde ein T-Shirt als Schuh beschriftet. Diese „verrauschten Labels“ sind wie Tippfehler in den Daten, die die KI verwirren können.
Trotzdem kann eine gute KI lernen, die richtigen Muster zu erkennen und solche Fehler zu ignorieren. Gerade bei sehr großen Datenmengen lässt sich selten verhindern, dass ein paar Labels falsch sind. Mit ausgeklügelten Methoden entwickelt die KI so eine gewisse „Fehlertoleranz“ und liefert am Ende trotzdem brauchbare Ergebnisse, etwa bei Produktempfehlungen oder Bilderkennung.
Lernen mit verrauschten Labels ist daher besonders wichtig, weil echte Daten selten perfekt sind. Es sorgt dafür, dass KI-Systeme robust und praxistauglich bleiben – auch wenn nicht alle Daten ganz sauber sind.