Data Augmentation ist ein wichtiger Begriff aus den Bereichen Künstliche Intelligenz, Big Data und Smart Data sowie Automatisierung. Es bezeichnet Methoden, mit denen bestehende Datensätze künstlich vergrößert oder erweitert werden, um eine bessere Grundlage für die Entwicklung und das Training von Algorithmen zu schaffen.
Angenommen, ein Unternehmen möchte eine künstliche Intelligenz entwickeln, die automatisch Fotos von Produkten erkennt. Dafür benötigt die KI viele verschiedene Bilder jedes Produkts. Oft sind aber nicht genug Fotos vorhanden. Hier kommt Data Augmentation ins Spiel: Mithilfe von Computerprogrammen werden aus den vorhandenen Bildern neue Varianten erstellt – zum Beispiel, indem die Farben verändert, das Bild gespiegelt oder leicht gedreht wird. So entstehen schnell und ohne großen Aufwand viele zusätzliche Daten.
Der Vorteil von Data Augmentation liegt darin, dass Algorithmen robuster und genauer werden, weil sie mit einer größeren Vielfalt von Beispielen trainiert werden können. Das spart Zeit und Geld, weil weniger echte Daten gesammelt werden müssen, und verbessert die Qualität der Ergebnisse von Künstlicher Intelligenz deutlich.