资 源 简 介
随着信息化时代的来临,大量数据的产生和收集导致信息大爆炸,数据挖掘技术已成为现在计算机科学的研究热点。聚类分析是数据挖掘中一种重要的挖掘任务和挖掘方法,使得聚类算法的效率和聚类质量在数据挖掘中起着至关重要的作用,也成了计算机科学领域的难题之一。基于密度的聚类算法是聚类分析的重要分支,以其能够发现任意形状的聚类、能够有效地处理噪声数据的优点在聚类算法中占有很重要的地位。算法是经典的基于密度聚类算法,它不但具有基于密度聚类算法的优点,而且聚类速度较快。但是该算法也有不足之处聚类参数选择困难当数据集密度分布不均匀时聚类质量差初始聚类对象随机选择造成时间浪费对所有种子对象进行区域查询造成时间和内存浪费。为解决算法中存在的问题,作者考虑到数据空间中的数据并不是独立的而是有一定的相互影响,结合数据场的思想对算法进行了改进,提出了一种新的基于数据场的密度聚类算法—。该算法将物质粒子间的相互作用及其场的描述方法引入抽象的数据空间,利用数据空间中数据场场势与数据密度分布之间的关系,对算法几个不足之处进行了改进。