登录| 注册    
收藏  点赞 

正态分布

连续性变数的一种最重要的理论分布。又称高斯(Gauss)分布。正态分布具有μ和σ两个参数,一般简记为N(μ,σ2)。正态分布的方程,即其概率密度函数fN(x)为: 正态分布 而累积函数FN(x)则为: 正态分布 它们的图像见图1、2。 图1 正态分布的fN(x) 图2 正态分布的FN(x) 因此

连续性变数的一种最重要的理论分布。又称高斯(Gauss)分布。正态分布具有μ和σ两个参数,一般简记为N(μ,σ2)。

正态分布的方程,即其概率密度函数fN(x)为:

正态分布

而累积函数FN(x)则为:

正态分布

它们的图像见图1、2

图1 正态分布的fN(x)

图2 正态分布的FN(x)

因此,x在任意两个定值a和b(b>a)间的概率可表示为:

正态分布

这可由FN(x)求得,即:

p(x<a)=FN(a),p(x≤b)=FN(b)

∴ p(a<x≤b)=FN(b)-FN(a)

正态分布的基本特性:①以平均数μ为原点,左右两侧分布对称,呈单峰形。故正态分布下,算术平均数、中数和众数三者相等。②在原点μ上的纵轴最高,多数次数集中于μ的附近;离μ愈远,次数愈少;μ±3σ以外的次数极少,只占总次数的0.27%,但曲线两尾皆以横轴为渐近线向左右无限延伸,永不交于横轴。故分布的全距为-∞到+∞。③令曲线与横轴之间的面积为1,则横轴的任何两个定值间的曲线下面积,等于它占总面积的成数,即落在这一范围内的概率。④μ确定正态分布的中心位置,σ确定它的变异度。不同的正态分布有着不同的μ和σ,故N(μ、σ2)是一个曲线系统,而不是一条曲线,见图3。

图3 正态分布的位置和形状(随μ和σ而不同)

为便于一般化的应用,需将正态分布标准化。即将观察值x标准化为正态标准离差u:

正态分布

于是标准化正态分布方程为:

正态分布

上式也称u分布方程。

标准化正态分布具有平均数μ=0和方差σ2=1,记作N(0,1)。φ(u)为u的概率密度函数。与u对应的φ(u)值可直接查正态分布的概率密度函数表得出。

u分布的累积函数记作F(u):

正态分布

又叫u的概率分布函数。由于u分布累积函数应用的很广泛,前人已算好所需要的各个F(u)值,可直接查正态累积函数表得出。

正态分布在统计理论和实际应用上都有重要意义,因为许多自然现象的概率分布都服从正态分布;②随机误差的分布也服从正态分布;大样本的许多统计数的分布如t分布、F分布、x2分布等,都可根据正态分布推导出来并予以拟合,等等。