Hierarchical Clustering ist ein wichtiger Begriff in den Bereichen Big Data und Smart Data sowie Künstliche Intelligenz. Es handelt sich um eine Methode, mit der große Datenmengen sinnvoll gruppiert werden können. Das Ziel von Hierarchical Clustering ist es, ähnliche Datenpunkte zu Gruppen, sogenannten Clustern, zusammenzufassen.
Stellen Sie sich vor, Sie haben tausende Kundendaten und möchten herausfinden, welche Kunden sich ähnlich verhalten. Mit Hierarchical Clustering sucht ein Computerprogramm zunächst die ähnlichsten Kunden und ordnet diese zusammen. Danach werden die zweitähnlichsten Gruppen miteinander verbunden, bis alle Daten in einer großen Hierarchie von Gruppen organisiert sind – wie ein Stammbaum, der immer weiter verzweigt.
Das Ergebnis ist eine übersichtliche Struktur, in der jedes Element zu einem bestimmten Cluster gehört. Unternehmen nutzen das beispielsweise, um ihre Zielgruppen besser zu verstehen und individuelle Angebote zu erstellen.
Ein anschauliches Beispiel: Ein Online-Shop möchte seine Produktbewertungen analysieren. Hierarchical Clustering erkennt automatisch ähnliche Bewertungstexte und gruppiert sie. So sieht der Shop sofort, welche Produkte oft für ihre hohe Qualität gelobt werden und welche häufig ähnliche Kritikpunkte erhalten. Das spart Zeit und hilft bei besseren Geschäftsentscheidungen.