Trainingsdaten-Versionierung ist ein wichtiger Begriff rund um Künstliche Intelligenz, Big Data und Smart Data sowie Automatisierung. Daten sind das Herzstück jeder KI-Anwendung. Damit eine KI immer besser wird, muss sie ständig mit neuen, qualitativ hochwertigen Daten „trainiert“ werden. Doch nicht jede Datensammlung bleibt gleich – sie verändern und entwickeln sich weiter.
Mit Trainingsdaten-Versionierung wird jeder einzelne Stand, jede Änderung oder Ergänzung an den Daten festgehalten. Das funktioniert ähnlich wie in der Software-Entwicklung, wo es verschiedene Versionen eines Programms gibt. So kann man stets nachvollziehen, mit welchen Daten eine KI trainiert wurde und wie sich diese im Laufe der Zeit entwickelt haben.
Ein anschauliches Beispiel: Ein Unternehmen nutzt eine KI, die automatisch Bilder von Produkten erkennt. Am Anfang wurden nur 5.000 Bilder verwendet, später kamen weitere 10.000 hinzu. Die Trainingsdaten-Versionierung erlaubt es, genau zu sehen, ab wann die zusätzlichen Bilder dabei waren, und wie sich dadurch die Erkennung verbessert hat. Das sorgt für Nachvollziehbarkeit, bessere Kontrolle und mehr Vertrauen in die Ergebnisse der KI.