多元线性回归-智汇三农

当前位置 :首页>百科>农作物>农作物试验设计及统计分析>统计分析>回归分析>多元线性回归

百科推荐检索

收藏点赞

多元线性回归

μ1，μ2，……，μm则分别为变数y，x1，x2，……，xm的总体平均数；βi（i＝1，2，……，m）为第i自变数在其余自变数皆固定时对于y变数的平均效应，称为偏回归系数。对于y变数的任一观察值yi而言，因尚具有随机误差εj，故其线性可加模型为：yj＝μy/12…m＋εj因而对一个容量为N的总体来说，其m元离回归方差为：多元线性回归当m元回归方程由容量为n的样本估计时

处理依变数y和两个或两个以上有线性关系的自变数的一种统计方法。设m个自变数x₁，x₂……，x_m与依变数y皆具线性关系，则一个m元线性回归模模型可定义为：

μ_y/12…m＝α＋β₁x₁＋β₂x₂＋…＋β_mx_m

上式为总体的m元线性回归方程。μ_y/12……m为以x₁x₂，……，x_m的取值为条件的y总体平均数。其中，α＝μy-β₁μ₁-β₂μ₂-……-β_mμ_m，为所有自变数皆为0值时y总体的理论值，而μy，μ₁，μ₂，……，μ_m则分别为变数y，x₁，x₂，……，x_m的总体平均数；β_i（i＝1，2，……，m）为第i自变数在其余自变数皆固定时对于y变数的平均效应，称为偏回归系数。

对于y变数的任一观察值y_i而言，因尚具有随机误差ε_j，故其线性可加模型为：

y_j＝μy_/12…m＋ε_j

因而对一个容量为N的总体来说，其m元离回归方差为：

多元线性回归

当m元回归方程由容量为n的样本估计时，则定义为：

多元线性回归

是μ_y/12……m的估值；a＝为α的估值；b_i为β_i的估值。根据回归的定义，这里的的统计数b_i需满足。

多元线性回归

…-b_m（x_m-）〕²为最小

因而首先可定义一个m×m的阶矩阵A：

多元线性回归

从而可得其m×m阶逆阵A^-1：

多元线性回归

于是即有：

多元线性回归

由此所得的m元线性回归方程，其回归平方和U_y/12……m、离回归平方和Q_y/12……m和离回归方差_……m分别为：

多元线性回归

这里的为，x₂，……x_m的估值，其根值S_y/12……m称m元离回归标准误。

由上述程序得到的m元线性回归方程，往往包含有对y并无显著效应的自变数，应通过H₀∶β_i＝0对H_A∶β_i≠0的统计假设进行测验。测验时可用统计数t或F：

多元线性回归

上述t值的自由度为（n-m-1），F值的自由度为v₁＝1，v₂＝（n-m-1）。若t＜t_α或F＜F_α，则为在α水平上接受H₀∶β_i＝0，该自变数即应在回归方程中剔除。但需注意，如果不显著的自变数有两个或两个以上，则只能先剔除｜t｜值（或F值）最小的那一个自变数，再作（m-1）元回归分析。这时，可能所有剩下的自变数都已达到显著，也可能仍有若干个不显著的。如属后一种情况，则再剔除｜t｜值（或F值）最小而不显著的那一个自变数，作（m-2）元回归分析。如此继续下去，直至方程中没有不显著的自变数为止。每剔除一个自变数（设为x_k）后，剩下各自变数的偏回归系数b_i（i≠k）和A^-1中元素C_ij（i，j≠k）都要改变取值。如果计算中保留了足够位数的有效数字，则新的b_i值（记作）和C_ij值（记作）可由原来的b_i和C_ij值算出：

多元线性回归

不必从头算起。

多元线性回归是多变数分析的基础，在生物学过程的预测预报和模拟研究等方面都有重要用途。它可用于：①确定各个自变数对某一依变数的各自效应和综合效应；②在大量自变数中选择对y有显著效应的自变数，建立最优的预测或模拟方程；③评定各个自变数对于控制y的相对重要性，以确定其中的关键因素。

[ 0 ]人参与 (点击查看)

匿名评论所有评论仅代表网友意见

热门百科

百科推荐检索

多元线性回归

友情链接

其他方式登录

其他方式登录