朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条
件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率
最大的输出y。朴素贝叶斯法实现简单,学习与预测的效率都很高,是一种常用的方法。
算法假定训练数据各属性列的值均是离散类型的。若是非离散类型的数据,需要首先进行数据的预处理,将非
离散型的数据离散化。
首先,将原训练元组按类别划分为<类别,属于该类别的训练元组>,其中利用
Map
>>datasOfClass(ArrayList> datas),d