资 源 简 介
几个注意事项: 1.如果自己造数据在写.names文件时最后‘.’后面要加个回车,不加会出错! 2.数据文件分3个,例如训练集在golf.data和golf.names中,预测数据集在golftest.data中。 3.这个数据集和c45的数据集一样,读取和存储都是借鉴C45原作者的方法写的。 4.最后训练出来的分类模型存在一个3维数组当中PostFreq[类][属性][属性值],这样比如方便预测 PostFreq存放的某个类下某个属性的属性值的频率。 5.这个和我以前传的差不多 我主要把那个模型也就是PostFreq[类][属性][属性值]中的值都写进“.model”文件了 ,然后在项目下有两个工程一个工程是用来 训练模型然后写进“.model”文件,另一个工程是预测的,它运行时只要读取“.model”文件就可以进行预测了,就不用在向我前面上传那个工程每回都要 训练一个PostFreq[类][属性][属性值]。 6.在VS2005下运行要先上载其中一个工程在运行另一个工程哦 7.所有的数据文件和生成的模型文件都放在data文件夹里了 这样方便2个工程读取数据。