研究一个依变量与多个自变量直接和间接相关关系的一种统计方法。通径分析方法是赖特(S.Wright)1921年提出来的。它的主要优点是能够借图解之助简明地阐明各变量之间的复杂关系。若设四个变量y、x1、x2、x3间存在线性关系。y为依变量(后果变量),x1、x2、x3为自变量(原因变量)
研究一个依变量与多个自变量直接和间接相关关系的一种统计方法。通径分析方法是赖特(S.Wright)1921年提出来的。它的主要优点是能够借图解之助简明地阐明各变量之间的复杂关系。
若设四个变量y、x1、x2、x3间存在线性关系。y为依变量(后果变量),x1、x2、x3为自变量(原因变量),则它们之间的关系可用通径(图1)表达。
图1 四个变量的通径图
图中单箭头线“←”表示变量间的因果关系,方向由原因到后果,称为通径,其系数即通径系数;双箭头线“←→”表示变量间的相互平行关系,称为相关线,其系数即相关系数。xi到y的通径系数记作Py·x,是度量原因变量对后果变量直接影响程度的一种统计量,是标准化的偏回归系数,等于偏回归系数乘以自变量标准差与依变量标准差之比。
通径分析
式中 bi为偏回归系数;Sx和Sy分别为xi和y标准差;SSx和SSy分别为xi和y的离均差平方和。
当偏回归系数为1时,通径系数就等于自变量标准差与依变量标准差之比。例如性状表型值P决定于育种值A与剩余值R,即P=A+R。这个表达式其实是一个多元回归方程的特殊形式,其bi=1,b0=0。因此PP·A=SA/SP,即育种值到表型值的通径系数等于育种值标准差与表型值标准差之比,也即遗传力的平方根,记作h。
经标准化,求偏回归系数的正规方程组(见多元线性回归)即演化成下列正规方程组:
r x=Py·x+r12Py·x+r13Py·x
通径分析
r xy=r31Py·x+r32Py·x+Py·x
因为标准化方差(或平方和)等于1,标准化协方差(或乘积和)等于相关系数,标准化偏回归系数等于通径系数。
这样,相关系数rx就剖分成两个部分:一是表示x1对y的直接影响程度Py·x;另一部分表示由x1通过其他变量x2和x3而对y的间接影响程度;r12Py·x+r13Py·x。同理,rx和rx亦可剖分成两个相应部分。
通径系数是标准化的偏回归系数,偏回归系数是排除其他相关变量影响后的回归系数,因此通径系数也反映排除其他相关变量后的两变量间关系,这一点与偏相关系数(见相关)相同。但通径系数与偏回归系数之间又有类似回归与相关间的区别,前者是单向的,后者是双向的。因此与偏回归系数一样,两个方向相反的通径系数的几何均数等于偏相关系数。ryx=。在只要求探明自变量对依变量的单向直接影响情况下,通径分析可以代替偏相关分析,同样可阐明两变量间在排除其他相关变量影响后的真实关系。这在畜禽育种工作中对性状关系的研究具有重要意义。
通径分析可以进行相关剖分,反过来,也可借助通径图来“合成”相关系数。结合图1和式(2)可以看到任何两变量间的相关等于所有连接它们的通径链的系数之和,而通径链系数则等于组成该通径链的所有通径和相关线的系数的乘积。例如x1与y间有三条通径链相连接,即y←x1,x1←→x2→y,x1←x3→y,三个通径链系数是,,,因此(2)式即分别表示x1与y,x2与y和x3与y的相关等于三个通径链组成系数之和。
这种相关的“合成”是非常有用的。数量遗传学中许多公式可以利用这个原理得到简明的推导。例如估计遗传力的公式就可以推导如下:设两亲属某性状的表型值分别为P1和P2,它们都决定于各自的育种值(A1和A2)和剩余值(R1和R2),这些变量间的通径见图2。
图2 两亲属表型值间的通径图
亲属育种值间相关rA即亲属间遗传相关rA1A2亲属剩余值间相关rR1R,主要是环境相关,可记为rE。月到P的通径系数即遗传力的平方根h;R到P的通径系数记作e。根据以上相关“合成”原理,可得
r P=hrAh+erEe=rAh2+rEe2
设亲属间没有共同环境,则rE=0,上式成
通径分析
如亲属为半同胞(HS),rP=rHs(半同胞表型相关),rA(HS)=1/4,rA(HS)-1=4,于是h2=4rHS。
同理,也可通过其他亲属间表型相关来估计遗传力。
通径系数是标准化偏回归系数,经标准化后,偏回归系数消除了单位,相互间就可以直接比较,为选择最优回归造成了方便。未标准化的偏回归系数,由于单位不同,不能相互比较以决定去留,必须先算出偏回归平方和才能相互比较。而偏回归平方和的计算需先计算逆矩阵元素,比较麻烦。特别是逐步回归,用标准化偏回归系数计算有很大方便。
所有评论仅代表网友意见