资 源 简 介
KNN-KSR方法是一种不直接建立自变量与因变量间数学关系去预测因变量的方法。该方法基于以下两个假设:(1)在所选择的样本描述指标信息足够完备时,性质越相似的样本在同类指标间的空间分布越接近,否则其空间距离也越大;(2)如果两类指标间存在较大关联度,则样本分别在两类指标内的空间分布也具有较大相似性。由此可以假设样本在自变量x空间的分布与其在因变量空间的分布相同,此即保形映射假设。
在这两个假设的基础上,根据目标样本在x空间中的位置特征,动态选取K个与其最接近的样本(简称为KNN)作为建模子集。其次不假设自变量x与因变量间存在某种数学(线性、非线性)关系,而是通过最优化方法在自变量空间寻找目标样本与K个最近邻样本间线性组合的权重系数,根据自变量与因变量之间存在保形映射的假设,用K个建模子集的因变量的线性组合来表示目标样本的因变量值[9]。
其步骤如下:
(1)借鉴模式识别来识别未知样本归属的K最近邻(KNN)方法的概念,在所有性质已知样本的自变量空间里通过欧式距离最小法挑选与目标样本的K个最邻近样本作为建模样本子空间。
(2)目标样本特征性质的构建:基于假设(2),则要使得预测特征与目标特 征性质尽可能相似,则要求在自变量空间X中构建的虚拟目标特征向量(假设该 向量由K个建模样本的自变量的线性组合构成)与真实的目标向量x尽可能接 近,数学表述为两向量之差的范数最小。
以构建的目标样本特征性质最接近确定每个样本的K值,以去除仪器噪声后的光谱信息确定主成分个数。