登录| 注册    
收藏  点赞 

作物试验设计

在作物试验中,确定试验处理和布置试验小区的原理和方法,要求能估计出试验误差,并使误差估计为无偏与最小的,从而可以较精确地评定处理效应。一般试验设计包括四个内容:根据试验目的,选用一组试验处理进行比较;确定试验用的试验单位或小区,以便布置试验处理;布置试验处理的法则;确定每个试验单位或小区应测量或记录的项目。由于作物试验多在田间进行,因此这类设计又称田间试验设计。

在作物试验中,确定试验处理和布置试验小区的原理和方法,要求能估计出试验误差,并使误差估计为无偏与最小的,从而可以较精确地评定处理效应。一般试验设计包括四个内容:根据试验目的,选用一组试验处理进行比较;确定试验用的试验单位或小区,以便布置试验处理;布置试验处理的法则;确定每个试验单位或小区应测量或记录的项目。由于作物试验多在田间进行,因此这类设计又称田间试验设计。

简史

科学的作物试验设计是20世纪以后的事。20世纪早期作物试验是无重复的,采用大区相邻排列,每区安置一个处理,进行相互比较,因为当时还没有试验误差的概念。1846~1847年J.B.劳斯(Lawes)和J.H.吉尔伯特(Gilbert)在英国罗瑟姆斯特(Ro-thamsted)试验场进行试验时,将大区从纵向裂为两半,这是历史上最早的田间试验重复区。1909年A.D.霍尔(Hall)和T.B.伍德(Wood)发现田间试验中植物和土壤变异的影响很重要,倡议必须估计试验误差并给出了估计方法。1910年伍德和F.T.M.斯特拉顿(Stra-ton)认为土壤、作物等均有巨大变异性,出现抽样误差,建议用多个小区(1平方码或0.8361平方米)进行试验以测定产量。1911年W.B.默塞尔(Mercer)和霍尔将1英亩小麦分为500个小区收割,发现小区产量呈正态分布,并从比较中得出试验小区面积以不大于1/40英亩或0.010公顷为合适。在美国,1907~1909年L.H.史密斯(Smith)研究美国玉米品种试验时指出,田间试验的主要而难以控制的变数是土壤变异性。这些研究为田间试验设计和小区技术的建立奠定了基础。在这期间统计学的应用起了重要作用。如1908年斯图特(Student,W.S.Gosset的笔名)采用平均数或差来比较两个品种的产量差异,这是农业试验的一个里程碑。他在论文里给出了t的抽样分布,并证明田间试验结果属于小样本性质,其总体方差可近似地加以估计,并用t测验比较品种间差异显著性。以后在沃明斯特(Warminster)由E.S.比文(Beaven)设计了著名的有重复的半条区方法用于品种比较试验。1919年在罗瑟姆斯特试验场R.A.费希尔(Fisher)始创“方差分析法”,并应用于比较品种等试验,特别适用于小区试验。1926年费希尔以及1930年费希尔和J.威沙特(Wishart)提出两种最常用的试验设计:随机区组和拉丁方设计,并阐明了试验设计的重复原理,这是近代试验设计的另一个里程碑。以后根据费希尔这个原理,不断产生各类新的试验设计,主要包括:1933年F.耶茨(Yates)提出的重复试验中的混杂原理,则用不完全区组的排列方式;1935年他又提出的复因子试验的混杂方案;1936~1937年提出的多品种试验的格子设计和分析方法。1937~1939年W.G.科克伦(Cochran)提出的田间长期试验设计,1945年后D.J.芬尼(Finney)提出的复因子试验设计的部分重复方法以及裂区混杂设计等等。1949年耶茨又提出农业轮作的试验设计。至此,作物试验设计已发展成为试验统计学的一门分支学科。

20世纪50年代以后在试验统计学中引进了模型建立并将其应用,这是一个新的发展。这是讨论所得资料如何用以建立模型以及如何利用这些模型的内容,如回归设计分析、反应面方法等。反应面回归设计是研究如何在因子空间中选择适当的试验点,使之能快速建立一个有效的多项式模型,从而解决最优化问题,其内容有一次、二次回归的正交设计,回归的旋转设计以及回归的D-最优设计等等。这些反应面方法设计发源于化学工业的试验研究,20世纪60年代以来逐步引进到复因子的作物试验中。

原理

近代田间试验的特点在于注意试验设计与统计分析的密切联系。为了取得这两个方面的结合,田间试验需注重三个基本原理:重复、随机排列和局部控制。同时应用方差分析,使试验误差得到无偏的估计,并降低到最低程度,从而提高了试验精确度。田间试验最大困难之一在于试验地土壤肥力的变异,这种困难在理论上可用重复原理加以克服。重复的目的是估计误差和减少误差。要完全达到这一目的,有两个必需条件:试验小区的“随机排列”,以实现无偏地估计试验误差;试验地土壤变异的“局部控制”,以降低试验误差到最小限度。这三个原理与两个目的的关系见图1。

图1 田间试验三个基本原理的关系

重复最重要的目的是估计误差,但这种估计是否无偏,不夸大或低估,则要求试验小区随机排列。重复试验所提供的误差估计是根据处理相同的各小区的相差数值。如果在布置试验小区时,使每一对处理相同的小区的位置不比任何一对处理不同的小区较近或较远,这样所估计的误差才是无偏的。随机排列就是为了获得无偏的误差估计。已往设计中倡用的顺序排列在理论上的缺点,就是估计误差时会出现过低或过高的结果,不能真实地反映试验应有的偶然误差。顺序排列的另一缺点是使各处理相互比较时其精确度并不相等,这是指排列距离较近的两处理间的真正差异不易显著,而位于较远距离的两处理间的非真正差异反倒容易出现显著的趋向。顺序排列的第三个缺点是不符合统计学上估计误差的原理,因各处理系按顺序方式排列,每一小区数值不是独立的随机样本,由此估计的误差难以达到正确程度。重复的另一目的为降低误差。从统计学上已知平均数比之个体观察值为可靠,这从下式可知:δ2=δ2/n,即平均数的方差与样本的重复数n成反比。所以重复数增多,试验精确度将随之增高。在田间试验上,由于土壤有变异,需增加重复小区,但随之而来的是增大了试验田面积,因而增大了土壤变异度,这样就会相应地增大误差估计。为克服这个困难,可将试验地划分为若干个区组,每一区组按供试的处理数再划分相同数目的小区,随机地再把各处理布置在同一区组内相邻的小区上。由于不同处理是排列在土壤较为一致的小区上,而且仅仅从区组内的差异来估计误差,所以增加重复并不会增大误差的估计。这种设置区组的方法称为“局部控制”。近代所有试验设计都是以“局部控制”原理为基础而发展起来的。

试验设计的种类

近代试验设计的种类按顺序排列与随机排列可分为两大类别。根据试验处理的多寡,区组设立是否形成重复,随机方法完全与否以及控制土壤变异的方向是单向或多向等等,又可分为若干类型。列表于下,并加以简要说明:

主要作物试验设计分类

顺序排列设计

包括对比设计和间比设计。对比设计的特点是每一供试品种均直接排列于对照区旁边,即每隔两个供试品种设一对照区。间比设计指每两个对照区之间排列相同数目的品种,一般安排4或9个品种。杆行试验则采用这两种排列设计进行。

杆行试验,这个育种程序于1925年引入中国,曾风行一时。所谓杆行指每品系种一行,行长1杆(16英尺等于5.0292米)。自花授粉作物育种中,首先分离纯系,种植穗行或株行。然后逐年对入选品系依次进行2杆行、5杆行、10杆行和高级试验等比较试验。所谓2杆行、5杆行、10杆行是指重复2次、5次和10次。上述杆行试验采用间比设计进行,开始时因品系多,仅设2次重复,以后逐年淘汰,留下为数较少的优良品系,可以依次增加重复。高级试验因品系数更少,则采用3行区按对比设计进行,重复10次。杆行试验的分析采用洛夫法(由H.H.Love倡导)。中国育种界在20~30年代普遍采用这一试验程序,40年代后改用一般顺序排列和随机排列设计。

随机排列设计

一般分为两类:一类于排列前不分区组,即打乱重复完全随机排列,如完全随机设计。另一类于排列前分为区组,在区组内随机排列,这属局部随机设计。后一类又可分为完全区组和不完全区组设计,前者指一个区组包括全部试验处理,相当于一个重复;后者指一个区组仅包含有一个重复的部分试验处理。完全区组设计包括有随机区组设计、拉丁方设计、交叉式设计、重叠拉丁方设计等几种类型。不完全区组设计也有许多类型,因试验要求和排列方法而异,一般可分为裂区设计、混杂设计和平衡不完全区组设计三大类型。

裂区设计

分主区和副区,将主区分裂为若干个副区,属混杂主区处理的设计,以增加副区效应和互作的精确度。特别适用于主区处理需较大面积的小区,如耕作、肥料试验等。现以5种主处理、2种副处理和3次重复的设计为例示意如图2。

图2 三个重复的裂区设计(主处理a有5种,副处理b有2种)

条区设计

适用于两个因子处理,均要求有较大面积的试验。将横向几个长条区组安置一个因子处理,另在纵向几个长条区组安置另一个因子处理,两个因子的处理组合都成为正角地分布于一个重复内。这类设计须估计三个误差,特别适用于互作精确度居很重要地位的试验。

混杂设计

特别适用于复因子试验。设计原理是牺牲一部分不重要的高级互作或主效,从而增加重要部分效应的精确度。普遍应用的有2n、3n和4n类型设计,每一区组处理数目则为2r、3r和4r(r<n),n为因子数,r则为每区组处理数的(n-1)或(n-2)等等。如处理数较多时可仅用1个重复。一般分为部分混杂设计与全部混杂设计两类。

格子设计

应用混杂原理于单因子试验的一种设计,特别适用于多品种试验,品种数即p2从36~196,p指不完全区组内的品种数,等于6…14。这类设计有简单的(仅X和Y组)、三组的(X、Y、Z组)、立方式(指p3)和矩形式(指p×q),另有平衡格子设计。

部分重复设计

用于因子较多而每因子的水平又较多的复因子试验。设计仅采用1/2、1/3或1/4个重复。

平衡不完全区组设计

这类设计要求各对处理在同一个不完全区组内出现的次数相等,从而使各个处理间的相互比较均获得相等的精确度。另外有部分平衡不完全区组设计,上述简单的、三组的格子设计均属之。现举出9个处理分配于每区组3个试验单位的平衡不完全区组设计,如图3。

图3 9个处理12个区组的平衡不完全区组设计

反应面回归设计

这类设计始创于50年代初期,统计分析称反应面方法(RSM),用以研究几个自变数x影响一个因变数y的结果,而y则称为反应,其目的在于探索这个反应如何达到最优效果。例如,探求其产品在温度(x1)与压力(x2)下,达到最高产量的程序,那么,其反应y就可作为两个自变数的函数,即:

y=f(x1,x2)+ε

ε为随机误差。如果以预期反应E(y)=n表示,则可绘出一个x和y为轴的平面以表示y=f(x1,x2),这就称为反应面。一般自变数与反应的关系模型并不知道,所以必须探索一个f的适当近似式。一般采用低级多项式回归模型,如一次回归模型,则:

y=β0+β1x1+β2x2+…+βkxk+ε

也可以采用二级或高级多项式模型。以往研究工作者仅采用一次一个变数的试验,反应面方法则将试验设计、数据处理与回归方程的精确度统一起来加以考虑,即根据目的和分析来选择试验点,从而取得最大量的信息,而又可减少试验次数。反应面设计包括有一次回归模型设计、二次回归模型设计、回归的旋转设计以及回归的最优设计等等。