资 源 简 介
本程序实现了k-最邻近分类算法
待处理数据共有150个,iris_data、Iris-versicolor、Iris-virginica各50个,
其中60个作为训练集,iris_data、Iris-versicolor、Iris-virginica各20个,
90个为检验集,iris_data、Iris-versicolor、Iris-virginica各30个,
训练集通过随机产生,剩余的通过判断归于检验集。
算法原理很简单:求出每个数据与训练集的“距离”(因为只要比较大小,未开四次方),让后对“距离”排序,
最后距离数组的前k个就是最近的,这k个距离相对应的类的最多数即为预测类。
结果输出错误分类的数据以及正确率,还可以通过多次执行程序,输入不同的k来测试合适的k,在此程序中当k=9是正确率达到最高。