聚类分析(K-means、系统聚类和二阶聚类)的原理、实例及在SPSS中的实现(一)
目录
聚类分析的定义及原理
聚类方法及其在SPSS中的实现
总结及拓展
聚类分析的定义及原理
1.定义
所谓物以类聚、人以群分。聚类分析,即是基于研究对象的特征,将他们分门别类,以让同类别的个体之间差异相对小、相似度相对大,不同类别之间的个体差异大、相似度小。
聚类分析是一种探索性分析方法,与判别分析不同,聚类分析事先并不知道分类的标准,甚至不知道应该分成几类,而是会根据样本数据的特征,自动进行分类。
聚类与分类的不同在于,聚类所要求划分的类是未知的
2.原理
假定研究对象均用所谓的“点”来表示。 在聚类分析中,一般的规则是将“距离”较小的点归为同一类,将“距离”较大的点归为不同的类。 常见的是对个案分类,也可以对变量分类,但对于变量分类此时一般使用相似系数作为“距离”测量指标。
一般的规则:
聚类方法及其在SPSS中的实现
1.主要的聚类
共有 0 条评论