资 源 简 介
关于模糊C-均值(FCM)聚类算法的改进关于模糊C-均值(FCM)聚类算法的改进∑∑md2(x1,v,)离有变化,即(1)式中改为(,)=|P)(x;-v大连大学学报其中W为模糊加权因子,由式(5)确定。在模糊¢一均值算法中引入模糊加权因4子,使得数据空间中各个数据点对同一橐类中心所具有的特征优势不同,导致对距离的贡献也不同,更具合理性,使得聚类效果更好,分类更清晰,改进数据预处理的方法。4数据仿真结果将200个二维数据分为三类。使用了两种方法,本文提出的改进的模糊聚类算法(引入了模糊加权因子),结果见图2;经典的模糊C-均值聚类算法6,结果见图3对比聚类效果图如通过对比两种算法的效果图可以看出:图图3FCM聚类效果图2是改进后的模糊聚类算法(引入了模糊加权刈比目标函数曲线如下因子)的效果图,聚类效果比图3经典的模糊C均值聚类算法更好,数据点更集中,有若干点集中在聚类中心上。我们可以看右下角的数据点,改进后的模糊聚类算法将紫色的点和蓝色的点能清楚的分开,两个类之间的界限很明显而模糊C-均值算法分类的程度就不是很清晰,分别属于两个类的绿色的点和紫色的点几乎重合,可见类与类之问划分不清晰。图4改进算法后的目标函数图图2改进算法后的聚类效杲图喷笔签义,引入了重要参数-模糊加权因子,模糊加权因子的引入,使得数据空间中各数据点所具有的特大连大学学征优势不同,导致对距离的贡献也不同,这是两种距离定义方法的根本区别之处。并且用数据仿真验证了这种改进了的模糊聚类算法比原来的算法聚类更有效,分类更清晰,速度快。参考文献O一0年第五期[l} Timothy J.Ros.模糊逻辑及其工栏应用[M].北京:电子工业出版社,20032]鲁宇,范希鲁.模糊加权距离及其合理性讨论[J].北方交通大学学报,1990(2)[3]王士同、神经模糊系统及其应用[M].北京:北京航天航空大学出版社,1998(6)图5FCM目标函数图T 4 1 Kazutaka Umuyaharu, Saclaaki MiyarIulo and Yoshiteru图4的是改进算法后的目标函数图(引入模糊Nakamori, Formulations of Fuzzy Clustering for Categorical加权因子),图5是经典的模糊C-均值算法目Data, International Journal of Innovative ComputingInformation and Control(lICIC), vol 1, no, 1, pp 83标函数图。可以看出图4的函数曲线比图5的函94,2005(3)数曲线更加平滑,收敛速度快。[5 Hugang Han, Information System with Fuzzy Weights5结论Intermational Journal of Innovative Computing, Information本文讨论的是对模糊C-均值聚类算法的改and Control JICIC ) vol. 2, no 3, pp 553-565, 2006进,在原有的模糊C-均值算法的基础上,用一种6]吴晓莉,林哲辉.MAⅣLAB埔助模湖系统设计[M.西安:新的定义距离的方法替代欧氏空间中距离的定西安电子科技大学出版社,2002.Improvement of the Fuzzy C-Means Clustering AlgorithmWANG Ying-jie Wang, BAI Feng-bo, WANG Jin-hui(1. College of Information Engineering, Dalian University, Dalian, 116622, China2. MSPD, HiSoft Technology Intemational Ltd., Beijing, 100074, China3. Beijing Electromechanical Engineering Insitute, Beijing, 100074, ChinaAbstract: An improvement algorithm about the fuzzy c-means clustering algorithm is discussed in this paper. Basedon original fuzzy c -rneans clustering algorithm, the improvement algorithm uses a new way of defining distance todisplace the distance in Euclidean space. Experimental results show that the improvement algorithm is better thanal algurithm and the classification is clearer than original algKey words Fuzzy c-means algorithm; Fuzzy weighted distance; Fuzzy weighted factor