资 源 简 介
PLS是用线性回归模型和最小二乘法把X(描述性变量)和Y(观察变量)投射到一个新的空间,从而能在X空间中的找到一个多维向量最大化表示出Y空间上的变化,找到X和Y最根本的联系。 正交偏最小二乘法(OPLS)是基于PLS的,把连续的变量正交(orthogonal) 投射到 latent structure,从而把变量分成了可以预测的和无关的两种,第一个latent variable可以解释X和Y之间的共同变化,也就是X中变化跟Y变化有关的,第二之后的latent variable是在X变化中对Y无关的(正交的)。如果是不连续的变量,就可以对不同的class进行分类,就是OPLS-DA。X是描述性变量的矩阵,Y是不同的class种类,同样的,第一个latent variable描述的是X中对between class有关联的变化,也就是X对Y分类有关的信息,后面与之正交的latent varible 描述的都是X中within class之间的变化,也就是对Y的分类无关。OPLS相比PLS,分类的准确率并没有改进,只是让结果能更好的被诠释和理解而已