资 源 简 介
聚类(clustering)就是将数据对象分组成为多个类或簇(cluster),在同一簇中的对象之间具有较高的
相似度,而不同的簇中对象差别较大。相异度是根据描述对象的属性值来计算的。距离是经常采用的度量
方式。聚类分析源于许多研究领域,包括数据挖掘,统计学,生物学,以及机器学习。 作为统计学的一个
分支,聚类分析已经被广泛的研究了许多年,主要集中在基于距离的聚类分析。基于k-means(k-平均值),
k-medoids(k-中心点)和其他一些方法的聚类分析工具已经被加入到许多统计分析软件包或系统中,
例如S-Plus,SPSS,以及SAS