聚类算法学习总结
一、基本理解
一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中。在聚类算法中根据样本之间的相似性,将样本划分到不同的类别中,对于不同的相似度计算方法,会得到不同的聚类结果,常用的相似度计算方法有欧式距离法。
二、API
klearn.cluster.KMeans(n_clusters=8)
参数:n_clusters:开始的聚类中心数量整型,缺省值=8,生成的聚类数,即产生的质心(centroids)数。
方法:estimator.fit(x)
estimator.predict(x)
estimator.fit_predict(x) 把训练和预测合并到一起
计算聚类中心并预测每个样本属于哪个类别,相当于先调用fit(x),然后再调用predict(x)
基本聚类算法:
import matplotlib.pyplot as plt
# from sklearn.datasets.samples_generator import make_blobs 已经废弃
聚类算法学习总结最先出现在Python成神之路。
共有 0 条评论