Der Begriff Semi-Supervised Learning stammt aus den Bereichen Künstliche Intelligenz, Big Data und Smart Data sowie Digitale Transformation. Semi-Supervised Learning bedeutet auf Deutsch „teilüberwachtes Lernen“ und ist eine Methode, mit der Computer selbstständig aus Daten lernen können.
Im Gegensatz zu herkömmlichem „Supervised Learning“, wo jede Information (zum Beispiel Tausende Fotos von Katzen und Hunden, die alle eindeutig beschriftet sind) vom Menschen gekennzeichnet wird, arbeitet Semi-Supervised Learning mit nur wenigen gekennzeichneten Daten und einer großen Menge an unbeschrifteten Daten. Das spart viel Zeit und Kosten, weil nicht jedes einzelne Bild oder jede Information von einem Menschen überprüft werden muss.
Ein einfaches Beispiel: Stellen Sie sich vor, eine Firma möchte ihre E-Mails automatisch nach „Spam“ und „Nicht-Spam“ sortieren. Sie hat nur 100 E-Mails, die bereits als „Spam“ oder „Nicht-Spam“ markiert sind, aber Tausende sind noch nicht markiert. Semi-Supervised Learning hilft, diese unmarkierten E-Mails zu analysieren und die Kategorisierung zu verbessern, indem es Muster erkennt.
Dadurch wird die künstliche Intelligenz effizienter und kann schneller wertvolle Entscheidungen treffen, selbst wenn nur wenig vorbereitete Daten zur Verfügung stehen.