《R语言与数据挖掘》⑦聚类分析建模
书籍:《R语言与数据挖掘》
作者:张良均
出版社:机械工业出版社
ISBN:9787111540526
本书由北京华章图文信息有限公司授权杭州云悦读网络有限公司电子版制作与发行
版权所有·侵权必究
写在前面
目前主流的聚类算法主要分为以下几种
K-Means K-均值聚类K-Medoids K-中心聚类DBSSCAN Density-based Spatial Clustering of Application with Noise 密度聚类HC Hierarchical Clustering 层次聚类,或者叫系谱聚类EM Expectation Maximization 期望最大聚类
K-Means K-均值聚类
但对于异常值或极值敏感,稳定性差,因此适合处理分布集中的大样本数据集。 聚类过程描述: 它的思路是以随机选取的k(预设类别数)个样本作为起始中心点,将其余样本归入相似度最高中
共有 0 条评论