Semisupervised-Lernen ist ein Begriff aus den Bereichen Künstliche Intelligenz, Big Data und Smart Data sowie Digitale Transformation. Diese Methode kommt immer dann ins Spiel, wenn Computer mit Daten trainiert werden, um beispielsweise Bilder zu erkennen oder Texte automatisch zu verstehen.
Das Besondere beim Semisupervised-Lernen ist, dass der Computer nicht nur auf „geleitete“ Daten, also Daten mit klaren Antworten, zugreifen kann, sondern auch auf viele Daten ohne Antworten. Das heißt: Ein kleiner Teil der Daten ist beschriftet (mit korrekten Ergebnissen), der große Rest aber nicht. Der Vorteil: Dadurch kann Künstliche Intelligenz auch dann lernen, wenn nicht für jedes Bild oder jede Information eine Antwort vorliegt.
Stellen Sie sich vor, Sie wollen einem Computer beibringen, Katzen auf Fotos zu erkennen. Sie haben 100 Fotos, auf denen Sie wissen, ob eine Katze abgebildet ist oder nicht – und tausende weitere, bei denen Sie es nicht wissen. Semisupervised-Lernen sorgt dafür, dass der Computer mit beiden Datenarten arbeiten kann. Das spart Zeit und Aufwand, denn das zeitintensive „Beschriften“ der Daten ist nur zum Teil nötig.
Kurz gesagt: Semisupervised-Lernen macht künstliche Intelligenz oft effizienter und günstiger, besonders wenn viele unbeschriftete Daten vorhanden sind.