Self-Supervised Learning ist ein Begriff aus den Bereichen Künstliche Intelligenz, Big Data und Smart Data sowie Automatisierung. Damit bezeichnet man eine innovative Methode, mit der Computer selbstständig aus großen Datenmengen lernen können, ohne dass dafür viele Menschen Daten von Hand vorbereiten oder beschriften müssen.
Bei Self-Supervised Learning versuchen Maschinen, vorhandene Informationen aus unstrukturierten Daten herauszufiltern und Muster zu erkennen – ähnlich wie Menschen, die neue Dinge oft durch Beobachten lernen. Das Besondere: Der Computer stellt sich selbst Aufgaben, die er dann mit den verfügbaren Daten zu lösen versucht.
Ein einfaches Beispiel: Stellen Sie sich vor, ein Computer soll verstehen, wie Sätze aufgebaut sind. Dazu bekommt er viele Texte, bei denen manchmal ein Wort ausgelassen ist. Seine Aufgabe: Das fehlende Wort zu erraten. Durch viele solcher Rätsel erkennt der Computer Zusammenhänge in den Texten, ohne dass ein Mensch jeden Satz einzeln kommentieren muss.
Self-Supervised Learning macht es Unternehmen leichter, die eigenen Datenbestände zu nutzen und automatisierte Systeme intelligenter zu machen – von Sprachassistenten bis zu automatisierten Qualitätskontrollen in der Industrie. So entstehen leistungsfähige KI-Anwendungen, auch wenn keine aufwendig etikettierten Trainingsdaten zur Verfügung stehen.