登录| 注册    
收藏  点赞 

多元线性回归

μ1,μ2,……,μm则分别为变数y,x1,x2,……,xm的总体平均数;βi(i=1,2,……,m)为第i自变数在其余自变数皆固定时对于y变数的平均效应,称为偏回归系数。对于y变数的任一观察值yi而言,因尚具有随机误差εj,故其线性可加模型为:yj=μy/12…m+εj因而对一个容量为N的总体来说,其m元离回归方差为: 多元线性回归 当m元回归方程由容量为n的样本估计时

处理依变数y和两个或两个以上有线性关系的自变数的一种统计方法。设m个自变数x1,x2……,xm与依变数y皆具线性关系,则一个m元线性回归模模型可定义为:

μy/12…m=α+β1x1+β2x2+…+βmxm

上式为总体的m元线性回归方程。μy/12……m为以x1x2,……,xm的取值为条件的y总体平均数。其中,α=μy-β1μ12μ2-……-βmμm,为所有自变数皆为0值时y总体的理论值,而μy,μ1,μ2,……,μm则分别为变数y,x1,x2,……,xm的总体平均数;βi(i=1,2,……,m)为第i自变数在其余自变数皆固定时对于y变数的平均效应,称为偏回归系数。

对于y变数的任一观察值yi而言,因尚具有随机误差εj,故其线性可加模型为:

yj=μy/12…m+εj

因而对一个容量为N的总体来说,其m元离回归方差为:

多元线性回归

当m元回归方程由容量为n的样本估计时,则定义为:

多元线性回归

是μy/12……m的估值;a=为α的估值;bi为βi的估值。根据回归的定义,这里的的统计数bi需满足。

多元线性回归

…-bm(xm-)〕2为最小

因而首先可定义一个m×m的阶矩阵A:

多元线性回归

从而可得其m×m阶逆阵A-1

多元线性回归

于是即有:

多元线性回归

由此所得的m元线性回归方程,其回归平方和Uy/12……m、离回归平方和Qy/12……m和离回归方差……m分别为:

多元线性回归

这里的,x2,……xm的估值,其根值Sy/12……m称m元离回归标准误。

由上述程序得到的m元线性回归方程,往往包含有对y并无显著效应的自变数,应通过H0∶βi=0对HA∶βi≠0的统计假设进行测验。测验时可用统计数t或F:

多元线性回归

上述t值的自由度为(n-m-1),F值的自由度为v1=1,v2=(n-m-1)。若t<tα或F<Fα,则为在α水平上接受H0∶βi=0,该自变数即应在回归方程中剔除。但需注意,如果不显著的自变数有两个或两个以上,则只能先剔除|t|值(或F值)最小的那一个自变数,再作(m-1)元回归分析。这时,可能所有剩下的自变数都已达到显著,也可能仍有若干个不显著的。如属后一种情况,则再剔除|t|值(或F值)最小而不显著的那一个自变数,作(m-2)元回归分析。如此继续下去,直至方程中没有不显著的自变数为止。每剔除一个自变数(设为xk)后,剩下各自变数的偏回归系数bi(i≠k)和A-1中元素Cij(i,j≠k)都要改变取值。如果计算中保留了足够位数的有效数字,则新的bi值(记作)和Cij值(记作)可由原来的bi和Cij值算出:

多元线性回归

不必从头算起。

多元线性回归是多变数分析的基础,在生物学过程的预测预报和模拟研究等方面都有重要用途。它可用于:①确定各个自变数对某一依变数的各自效应和综合效应;②在大量自变数中选择对y有显著效应的自变数,建立最优的预测或模拟方程;③评定各个自变数对于控制y的相对重要性,以确定其中的关键因素。