Der Begriff Dataset Shift stammt aus den Bereichen Künstliche Intelligenz, Big Data und Smart Data sowie Digitale Transformation. Dataset Shift beschreibt eine Veränderung in den Daten, mit denen beispielsweise Künstliche Intelligenzen oder Algorithmen arbeiten. Das bedeutet: Die Daten, die zur Entwicklung und zum Training von Modellen verwendet wurden, unterscheiden sich plötzlich von den Daten, die das System später im Einsatz erhält.
Ein einfaches Beispiel aus der Praxis: Eine Firma entwickelt ein System zur Erkennung von Betrugstransaktionen im Onlinehandel. Das System wird mit Daten aus den letzten Jahren trainiert. Doch plötzlich ändert sich das Kundenverhalten, etwa weil viele Menschen wegen eines neuen Trends auf eine bestimmte Zahlungsmethode umsteigen. Die bisherigen Daten beschreiben dieses neue Verhalten aber nicht. Das Modell trifft dadurch häufiger falsche Entscheidungen.
Dataset Shift kann dazu führen, dass KI-Modelle oder Datenanalysen weniger zuverlässig werden oder sogar völlig falsche Ergebnisse liefern. Unternehmen müssen deshalb regelmäßig überprüfen, ob ihre Modelle auch mit neuen, veränderten Daten noch richtig arbeiten. Nur so nutzen sie das volle Potenzial von Künstlicher Intelligenz und Big Data und vermeiden teure Fehlentscheidungen.