Clusteranalyse

Mit der Clusteranalyse werden die Beobachtungen (Fälle) zu Clustern zusammen gefasst.

Sich ähnelnde Beobachtungen liegen im gleichen Cluster. Die Beobachtungen aus verschiedenen Clustern sind sich weniger ähnlich.

Die Clusteranalyse ist ein exploratives Verfahren, für das verschiedene Methoden zur Verfügung stehen.

Du hast die Wahl zwischen partitionierenden und agglomerativen (hierarchischen) Verfahren. Außerdem wählst Du zwischen verschiedenen Distanzmaßen und Fusionierungsalgormithmen aus.

Die Variablen, die für die Clusteranalyse verwendet werden, können verschiedenes Messniveau haben. 

Welche Variablen Du für die Clusteranalyse einsetzt, sollte inhaltlich motiviert sein. 

Im Anschluss an die Clusteranalyse werden meist deskriptive Statistiken und manchmal auch weitere Verfahren für die Untersuchung von Lageunterschieden gerechnet, um die Cluster zu beschreiben und Unterschiede zwischen den Clustern aufzuzeigen.

In der Bibliothek der Statistik-Akademie findest Du folgende Materialien zur Clusteranalyse, die diese Methode ausführlicher behandeln und Dir die Umsetzung anhand von Software zeigen:

Clusteranalyse

  • Methodische Infos
  • Online-Seminar mit Slides als PDF

Clusteranalyse mit R

  • R-Skript
  • Beispieldaten
  • Videotutorial

Clusteranalyse mit SPSS

  • SPSS-Syntax
  • Beispieldaten
  • Videotutorial