资 源 简 介
预测蛋白质的结构是重要的生物化学由于三维结构可以从被发现在二级结构确定局部褶皱。此外,了解蛋白质的三级结构可以帮助确定他们的功能。本文的目的是比较性能的神经网络(NN)和支持向量机(SVM)预测的62个球状蛋白质的初级序列的二级结构。对于每一个神经网络和支持向量机的,我们创造了六个二进制分类器区分类别之间的螺旋(H),链(E),和线圈(C)。我们使用弹性BP神经网络训练和无提前终止。我们使用神经网络没有隐层或具有一个隐层,隐层神经元的1,2,40…。我们使用高斯核支持向量机固定在= 0.1和不同的成本参数C的范围在10倍交叉验证得到正确预测的概率估计总体参数。我们的实验表明,神经网络和支持向量机,不同的分类有不同的精度:69%正确的预测,线圈与非线圈多达80%站与非链正确的预测。这进一步表明,神经网络没有隐层或不超过2个隐藏的隐层神经元为更好的预测是足够的。我们表明,SVM估计精度不依赖于成本参数的值。作为一个重要的结果,我们将证明,神经网络和SVM分类精度估计不能区分。这与生物信息学中的一个现代的信念,SVM优于其他预测。关键词:神经网络,支持向量机,预测蛋白质的二级结构