Data Drift ist ein Begriff aus den Bereichen Künstliche Intelligenz, Big Data und Smart Data sowie Digitale Transformation. Er beschreibt eine Veränderung der Daten, die für ein automatisches System oder eine Künstliche Intelligenz genutzt werden.
Stellen Sie sich vor, ein Unternehmen nutzt eine KI, um die Nachfrage nach Produkten vorherzusagen. Die KI hat das System auf vergangenen Daten trainiert, z. B. zu bestimmten Jahreszeiten kaufen Kunden mehr Regenschirme. Doch plötzlich ändern sich die Einkaufsgewohnheiten der Kunden, etwa weil ein länger andauernder Sommer weniger Regen bringt. Die alten Daten stimmen nicht mehr mit den aktuellen Bedingungen überein.
Das ist Data Drift: Die Daten, mit denen das System ursprünglich trainiert wurde, unterscheiden sich über die Zeit hinweg von den aktuellen Daten. Folge: Die Vorhersagen oder Entscheidungen der KI werden unzuverlässig oder sogar falsch.
Data Drift ist wichtig zu erkennen, da betroffene Unternehmen sonst auf Basis veralteter Informationen handeln. Das Monitoring und regelmäßige Anpassen von Algorithmen sorgt dafür, dass Künstliche Intelligenz und Big Data-Lösungen auch unter sich ändernden Bedingungen korrekt arbeiten.