• 广州市白云区人民法院公告专栏 2019-08-20
  • 北京:十二届市委启动第四轮巡视 2019-08-14
  • 单眼皮泡泡眼女生看过来,你的眼妆应该要这样化! 2019-08-14
  • 杨木森:梦想从这里远航 2019-08-03
  • 澳大利亚施压太平洋岛国搅黄中企商业项目后 竟自己承包了 2019-08-03
  • 十年整装再出发 东阳红木家具市场现代家居生活馆深耕新中式 2019-07-30
  • 进口车调价大比拼 谁家才是真“厚道” 2019-07-30
  • 地铁车厢人来人往的空间内,聚集着参差百态的灵魂 2019-07-15
  • 2018 Yorkville Exotic Car Show kicks off in Toronto - Culture News - CQNEWS 2019-06-25
  • 首付贷等违规行为料再遭“严打” 2019-06-25
  • 母亲节丨童言无忌 幼儿园的“10后”们想对妈妈说.... 2019-06-24
  • 落户新政后天津楼市突变 每平米房价一夜之间涨了两三千 ——凤凰网房产北京 2019-06-23
  • 49只“神话之鸟”中华凤头燕鸥返回象山韭山列岛 2019-06-10
  • 银保监会新规剑指大企业多头融资和过度融资 2019-06-09
  • Gucci正式和LV宣战:我们要成为最大的奢侈品品牌 2019-05-21
  • 北京十一选五开奖结果
    学霸学习网 这下你爽了

    天津快乐10分预测:第3章理论分布与抽样分布_图文

    北京十一选五开奖结果 www.frdg.net 第3章 理论分布与抽样分布
    1 理论分布 1.1二项分布 1.2泊松分布 1.3正态分布

    2 抽样分布
    样本平均数的抽样分布、两样本平均

    数差数的抽样分布、t分布

    随机变量
    做一次试验,其结果有多种可能。每一 种可能结果都可用一个数来表示,把这些数 作为变量x的取值范围,则试验结果可用变 量x来表示。 【例】 对1000听鱼罐头进行抽查,其可 能结果是“0听可食”、 “1听可食”、“2 听可食”、“…”、“100听可食”……若用 2、…、100……

    x表示可食用的罐头听数,则x的取值为0、1、

    【例】 孵化一枚种蛋可能结果只有两 种,即“孵出小鸡”与“未孵出小鸡”。 若用变量x表示试验的两种结果,则可令 x=0表示“未孵出小鸡”,x=1表示“孵出 小鸡”。 【例】 测定某产品净重 ,表示测定 结

    果 的 变 量 x 所 取的值为一个特定范围
    (a,b),如1.35-1.5kg,x值可以是这个范围

    内的任何实数。

    如果表示试验结果的变量x,其可能取 值一一列出 ,且 以各种确定的概率取这些 不同的值 , 则 称 x 为 离 散 型 随 机 变 量 ( discrete random variable);
    如果表示试验结果的变量x ,其可能取 值为某范围内的任何数值 ,且x在其取值范 围内的任一区间中取值时,其概率是确定 的,则称x为 连续 型 随 机 变 量 (continuous random variable)。

    离散型随机变量的概率分布
    要了解离散型随机变量x的统计规律, 就必须 知 道它的一切可能值xi及取每种可 能值的概率pi。 如果我们将离散型随机变量x的一切可 能取值xi ( i=1, 2 , … ),及其对应的概率pi, 记作

    P(x=xi)=pi

    i=1,2,…

    则称 上式为离散型随机变量x的概率分布或 分布。常用 分 布 列 (distribution series) 来表示离散型随机变量:

    x1 x2 … xn
    p1 p2 … pn

    ….


    显然离散型随机变量的概率分布具有 pi≥0和Σpi=1这两个基本性质。
    连续型随机变量的概率分布 连续型随机变量 (如体长、体重)的概率 分布不能用分布列来表示, 因为其可能取 的值是不可数的。我们改用随机变量x在某 个区间内取值的概率P(a≤x<b)来表示。 下 面通过频率分布密度曲线予以说明。

    由图2-6做100听罐头净重资料的频率分 布直方图 ,可以设想 ,如果样本取得越来 越大(n→+∞),组分得越来越细(i→0),某一 范围内的频率将趋近于一个稳定值 ── 概率。 这时 , 频率分布直方图各个直方上端中点 的联线 ── 频率分布折线将逐渐趋向于正态 分布曲线。

    上一张 下一张 主 页

    退 出

    1.1 二项分布
    1.1.1贝努利试验及其概率公式

    对于n次独立的试验 , 如果每次试验结果出
    现且只出现对立事件A与 A 之一, 在每次试验中

    出现A的概率是常数p(0<p<1) , 因而出现对立事


    A

    的概率是1-p=q,则 称 这一串重复的独立试

    验为n重贝努利试验,简称贝努利试验(Bernoulli trials )。

    例如 为了确定抛掷一枚硬币发生正面朝上 这个事件的概率 ,历史上有人作过成千上万次 抛掷硬币的试验。在表3-A中列出了他们的试 验记录。
    表3-A 抛掷一枚硬币发生正面朝上的试验记录

    贝努利试验符合 P(x=1)=p P(x=0)=q 其中 x=1 出现成功 x=0 出现失败 (3-1)

    在食品科学研究中,我们经常碰到的一类离散型 机变量,如n听罐头的变质数量等,可用贝努利试验 来概括。 在n次贝努利试验中,事件 A 可能发生0,1, 2,…,n次,事件 A 恰好发k(0≤k≤n)次的概率Pn(k)。 k=0,1,2…,n (3-2) Pn (k ) ? Cnk p k q n?k 随机变量X所有可能取值0,1,2…,n

    (3-3)

    P( x ? k ) ? P n (k ) ? ? Cnk p k q n?k
    k ?0 k=0,1,2…,n

    n

    1.1.2 二项分布的定义及特点 二项分布定义如下: n,且有
    k P( x ? k ) ? Pn (k ) = C n p k q n?k

    设随机变量x所有可能取的值为:0,1,2,…,

    k=0,1,2…,n

    其中p>0,q>0,p+q=1,则称随机变
    量x服从参数为n和p的二项分布 (binomial distribution),记为 x~B(n,p)。

    二 项 分布是一种离散型随机变量的概率 分布。参数n称为离散参数 , 只能取正整数; p 是连续参数,它能取0与1之间的任何数值。
    容易验证,二项分布具有概率分布的一 切性质,即:

    1、P(x=k)= Pn(k) ≥0 (k=0,1,…,n)
    2、二项分布的概率之和等于1,即

    ?
    n k ?0

    k C n p k q n ?k ? ( p ? q ) n ? 1

    3、 4、

    k P( x ? m) ? Pn (k ? m) ? ? C n p k q n?k k ?0
    n

    m

    (3-4) (3-5)

    P( x ? m) ? Pn (k ? m) ?

    k ?m

    ?

    k Cn

    p q
    m2

    k

    n ?k

    5、P(m1 ? x ? m2 ) ? p n (m1 ? k ? m2 ) ?
    (m1<m2)

    k ? m1

    ?

    k Cn

    p q

    k

    n?k

    (3-6)

    二项分布由n和p两个参数决定: 1、当p值较小且n不大时 ,分 布 是偏

    倚的。但随着n的增大 ,分布逐渐趋于对
    称,如图3-1 所示;

    2、当 p 值 趋 于 0.5 时 ,分 布 趋于对 称, 如图3-2所示;

    3、对于固定的n及p,当k增加时,Pn(k)先 随之增加并达到其极大值,以后又下降。

    1.1.3二项分布的概率计算及应用条件 今在该批食品中随机抽取6份食品,求正好有

    【例3.1】 有一批食品,其合格率是0.85, 5份食品都合格的概率?
    5份食品都合格概率为:
    6! P( x ? 5) ? C 0.85 0.15 ? ? 0.855 ? 0.151 ? 0.3993 5! ! 1
    5 6 5 1

    最少有4份合格: 6
    4 4

    P ( x ? 4) ? ? cn p x q n ? x
    x x?4 2 5 5 1 6

    ? c6 0.85 0.15 ? c6 0.85 0.15 ? c6 0.856 0.150 ? 0.9525

    最多有4份合格
    P( x ? 4) ? ? cn p x q n ? x
    x x ?0 4

    ? c6 0.85 0.15 ? c6 0.85 0.15 ? c6 0.852 0.154
    0 0 6 1 1 5 2

    ? c6 0.85 0.15 ? c6 0.854 0.152
    3 3 3 4

    ? 0.22350

    二项分布的应用条件有3点: (1) 一对互斥事件

    (2) (p+q=1),P是稳定值。

    (3) n次结果相互独立

    1.1.4二项分布的平均数与标准差

    统计学证明,服从二项分布B(n,p)的随 机变量之平均数μ、标准差σ与参数n、p有 如下关系:(即次数平均数、标准差)
    当试验结果以事件A发生次数k表示时 μ=np σ2= npq σ= (3-7)

    npq

    当试验结果以事件A发生的频率k/n或 百分数表示时(即样本平均数、标准差) (3-8) ? p ? p ? ? ( pq) / n
    ?

    也称为总体百分数标准误,当 p 未 ? 知时,常以样本百分数 p 来估计。此时 (3-8) 式改写为: ? ? ? ? q ? 1 ? p (3-9) = p(1 ? p) Sp n
    S p 称为样本百分数标准误。

    ?p

    ? 现从一批产品中抽出500件(n),发现有

    害微生物超标的产品有7件(x)。求超标 产品样本百分数标准误?

    7 ? p? ? ? 0.014 n 500
    S p? ? ? ? p(1 ? p) ? n

    ?

    0.014 ? (1 ? 0.014 ) ? 0.005254 500

    1.2 泊松分布
    泊松分布是一种 可以用来描述和分 析随机地发生在单位空间或 时间里的稀有 事件(小概率事件)的概率分布。要观察 到这类事件,样本含量 n 必须很大 。

    Can u give me some examples

    小概率事件

    若随机事件的概率很小,例如小于0.05、
    0.01、0.001,称之为小概率事件。

    1.2.1 泊松分布的意义
    若随机变量x(x=k)只取0,1,2,…n, 且其概率分布为
    P( x ? k ) ?

    ?k
    k!

    e ??

    , k=0,1,……n (3-10)

    其中λ>0;e=2.7182… 是自然对数的 底数,则 称 x 服 从 参 数 为 λ 的泊松分布 (Poisson‘s distribution),记 为 x~P(λ)。

    泊松分布重要的特征: 平均数和方差相等,都等于常数λ,即

    μ=σ2=λ

    λ是泊松分布所依赖的唯一参数。 λ值愈 小分布愈偏倚,随着λ的增大 ,分 布趋于对称 (如图3-3所示)。当λ= 20时分布接近于正态分布;

    当λ=50时, 可以认 为泊松分布呈正态分布。
    所以在实际工作中,当 λ≥20时就可以用正态分 布来近似地处理泊松分布的问题。

    1.2.2 泊松分布的概率计算及应用条件
    例3- 4 食品店每小时光顾的顾客人数服从λ=3 的泊松分布,即x~p(3)分布。 (1)计算每小时恰有5名的顾客的概率;

    (2)1小时顾客不超过5人的概率;
    (3)1小时内顾客最少有6人的概率。

    但是在大多数服从泊松分布的实
    例中,分布参数λ往往是未知的,只能 从所观察的随机样本中计算出相应的 样本平均数作为 λ 的 估计值,将其代 替(3-10)式中的λ,计算出 k = 0,

    1,2,… 时的各项概率。

    【例3-6】 为监测饮用水的污染情况, 现检验某社区每毫升饮用水中细菌数 , 共 得400个记录如下:表3-1饮用水中细菌测试 记录

    试分析饮用水中细菌数的分布是否服从 泊松分布。若服从,按泊松分布计算每毫升 水中细菌数的概率及理论次数并将頻率分布 与泊松分布作直观比较。

    样本均数计算结果如下:
    x =Σfk/n
    =(243×0+120×1 31×2+6×3)/400 =0.500

    2计算 方差S
    s2 ? ? fk 2 ? (? fk ) 2 / n ?

    n ?1 2 (243 ? 0 2 ? 120 ?12 ? 31? 2 2 ? 6 ? 32 ) ? (200 ) / 400 400 ? 1

    ? 0.496

    经计算得每毫升水中平均细菌数

    x

    =0.500,方差S2=0.496。两者很接近, 故可 认为每毫升水中细菌数服从泊松分布。以 x

    =0.500代替(3-10)式中的λ,得
    0.5 k ?0.5 (k=0,1,2…) P( x ? k ) ? e k!

    计算结果如表3-2所示。

    表3-2 细菌数的泊松分布

    可见细菌数的频率分布与λ=0.5的泊松分 布是相当吻合的 , 进一步说明用泊松分布 描述单位容积(或面积)中细菌数的分布是适 宜的。

    泊松分布的应用条件。 (1)随机单位时间和单位空间的稀有事件; (2)在n→∞,p→0, 且 n p =λ(较小常数)情 况下 ,二项分布 趋于泊松分布; (3)每次试验结果相互独立。 对于在单位时 间、单位面积或单位容积内,所观察的事物 由于某些原因分布不随机时,不是泊松分布。 (Such as contagion, Bacteria Group in milk)

    1.3 正态分布
    正态分布是一种很重要的连续型 随机变量的概率分布。有许多变量是 服从或近似服从正态分布。

    1.3.1正态分布的定义及其特征
    (一) 正态分布的定义 若连续型随机变 量x的概率分布密度曲线为
    f ( x) ? 1
    ? ( x?? )2 2? 2

    ? 2?

    e

    (3-11)

    其中μ为平均数,σ2为方差,则称随机变 量x服从正态分布(normal distribution), 记为x~N(μ,σ2)。相应的概率分布函数为
    F ( x) ? 1

    ?

    2?

    ?

    x

    ?

    ( x?? )2 2? 2

    ??

    e

    dx (3-12)

    分布密度曲线如图3- 4(上一张图)所示。

    (二) 正态分布的特征
    正态分布密度曲线是单峰、对称的悬钟 形曲线,对称轴为x=μ; f(x) 在 x =μ 处达 到 极 大 , 极大 值 f (? ) ?
    1

    ? 2?

    ;

    f(x)是非负函数,以x轴为渐近线,分布 从-∞至+∞;曲线在x=μ±σ处各有一个拐点

    正态分布有两个参数,即平均数μ和标准 差σ。 μ是位置参数,如图3-5所示。 当σ恒定 时,μ愈大,则曲线沿x轴愈向右移动;反之, μ愈小,曲线沿x轴愈向左移动。 σ是变异度参数, 如图3-6所示 。 当μ恒 定时, σ愈大,表示 x 的取值愈分散, 曲线 愈“胖”;σ愈小,x的取值愈集中在μ附近, 曲线愈“瘦”。

    x?

    ? ?3 ?

    分布密度曲线与横轴所夹的面积为1,即:

    1 P(?? ? x ? ??) ? ? ?? ? 2?

    ??

    ( x ?? )2 ? 2? 2 dx ? 1 e

    1.3.2标准正态分布
    将一般的N(μ,σ2) 转 换为

    μ= 0,σ2=1的标准正态分布。

    我们称μ=0,σ2=1的正态分布为标准正态 分布(standard normal distribution)。 标准正态分布的概率密度函数及分布函 数分别记作ψ(u)和Φ(u),由 (3-13)及(3-14) 式得:
    ? (u ) ?
    ?(u ) ? 1 2?
    1 2? e
    ? u2 2

    (3-13) (3-14)

    ?

    u

    ??

    e

    1 ? u2 2

    du

    随机变量u服从标准正态分布,记作u~ N(0,1),分布密度曲线如图3-7所示。

    对于任何一个服从正态分布N(μ,σ2)的随
    机变量x,都可以通过标准化变换:

    u=(x-μ)/σ
    量u。

    (3-15)

    将 其变换为服从标准正态分布的随机变 u 称 为 标 准 正 态变量或标准正态离 差(standard normal deviate)。

    三、正态分布的概率计算
    (一)标准正态分布的概率计算

    设u服从标准正态分布,则 u 在[u1,u2 )
    何内取值的概率为:
    1 P(u1 ? u ? u 2 ) ? 2?

    ?

    u2

    u1

    e

    1 ? u2 2

    1 du ? 2?

    ?

    u2

    ??

    e

    1 ? u2 2

    1 du ? 2?

    ?

    u1

    ??

    e

    1 ? u2 2

    du

    =Φ(u2)-Φ(u1)

    (3-16)

    而Φ(u1)与Φ(u2)可由附表1查得。

    P(u1 ≤ u < u2)=Φ(u2)-Φ(u1)由此 式 及正态分布的对称性可推出下列关系式, 再 借助附表1 , 便能很方便地计算有关概率: P(0≤u<u1)=Φ(u1)-0.5

    P(u≥u1) =Φ(-u1)
    P(|u|≥u1)=2Φ(-u1) (3-17)

    P(|u|<u1)=1-2Φ(-u1)
    P(u1≤u<u2)=Φ(u2)-Φ(u1)

    【例3-7】 已知u~N(0,1),试求: (1) P(u<-1.64)=?

    (2) P (u≥2.58)=?
    (3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =?

    利用(3-17)式,查附表1得:

    (1) P(u<-1.64)=0.05050
    (2) P (u≥2.58)=Φ(-2.58)=0.004940

    (3) P (|u|≥2.56)
    =2Φ(-2.56)=2×0.005234

    =0.010468
    (4) P (0.34≤u<1.53)

    =Φ(1.53)-Φ(0.34)
    =0.93699-0.6331=0.30389

    关于标准正态分布,以下几种概率应当熟
    记:

    P(-1≤u<1)=0.6826
    P(-2≤u<2)=0.9545 P(-3≤u<3)=0.9973 P(-1.96≤u<1.96)=0.95 P (-2.58≤u<2.58)=0.99

    u变量在上述区间以外取值的概率分别为:
    P(|u|≥1)=2Φ(-1)=1- P(-1≤u<1)

    =1-0.6826=0.3174
    P(|u|≥2)=2Φ(-2)

    =1- P(-2≤u<2)
    =1-0.9545=0.0455

    P(|u|≥3)=1-0.9973=0.0027
    P(|u|≥1.96)=1-0.95=0.05

    P(|u|≥2.58)=1-0.99=0.01

    (二)一般正态分布的概率计算
    正 态 分 布 密度曲线和横轴围成的一个

    区域,其面积为1,这实际上表明了“随机 其概率为1。
    若随机变量 x服从正态分布N(μ,σ2),则x

    变量x取值在-∞与+∞之间”是一个必然事件,

    的取值落在任意区间 [x1, x2) 的概率 ,记
    作P(x1≤ x <x2),等于图3-8 中阴影部分曲

    边梯形面积。即:

    P( x1 ? x ? x2 ) ?

    1

    ? 2?

    ?

    x2

    e

    ( x ? ? )2 ? 2? 2

    dx

    (3-18)

    x1

    作变换u=(x-μ)/σ,得dx=σdu,故有
    1 P( x1 ? x ? x2 ) ? ? 2?
    ? 1 2?

    ?
    u2

    x2

    x1

    e

    ( x ?? )2 ? 2? 2

    1 du ? ? 2?

    ?

    ( x2 ?? ) / ?

    ( x1 ?? ) / ?

    e

    1 ? u2 2

    ?du

    其中,
    u1 ?

    ?

    u1

    e

    1 ? u2 2

    du ? ?(u 2) ?(u1) ?
    x2 ? ?

    x1 ? ?

    ?

    , u2 ?

    ?

    【例】 设x服从μ=30.26,σ2=5.102的正态分布, 试求P(21.64≤x<32.98)。

    x ? 30 .26 u? 5.10

    则u服从标准正态分布,故

    21.64 ? 30.26 x ? 30.26 32.98 ? 30.26 P(21.64 ? x ? 32.98) ? P( ? ? ) 5.10 5.10 5.10
    =P(-1.69≤u<0.53) =Φ(0.53)-Φ(-1.69) =0.7019-0.04551 =0.6564

    【例3-8】 设x服从x~N(100,22)的正态分布,试 求P(100≤x<102)?

    100 ? 100 x ? 100 102 ? 100 P(100 ? x ? 102 ) ? P( ? ? ) 2 2 2
    =P(0≤u<1)
    =Φ(1)-Φ(0)

    =0.8413-0.5000
    =0.3413

    关于一般正态分布,以下几个概率(即 随机变量x落在μ加减不同倍数σ区间的概 率)是经常用到的。 P(μ-σ≤x<μ+σ)=0.6826 P(μ-2σ≤x<μ+2σ) =0.9545 P (μ-3σ≤x<μ+3σ) =0.9973 P (μ-1.96σ≤x<μ+1.96σ) =0.95 P (μ-2.58σ≤x<μ+2.58σ)=0.99

    统计中,不仅注意随机变量x落在平均数 加减不同倍数标准差区间(μ-kσ,μ+kσ)之内 的概率而且 也很 关心 x落在此区间之外的 概率。 我们把随机变量x落在平均数μ加减不同 倍数标准差σ区间之外的概率称为双侧概率 (两尾概率),记作α。

    对应于双侧概率可以求得随机变量x小于 μ-kσ或大于μ+kσ的概率,称为单侧概率(一 尾概率),记作α/2。

    例如,x落在(μ-1.96σ,μ+1.96σ)之外的 双侧概率为0.05,而单侧概率为0.025。即
    P(x<μ-1.96σ)= P(x>μ+1.96σ)=0.025

    双侧概率或单侧概率如图3-9所示。 x落在(μ-2.58σ,μ+2.58σ)之外的双侧概率 为0.01,而单侧概率
    P(x<μ-2.58σ)= P(x>μ+2.58σ)=0.005

    【例3.9】 已知某饮料罐内饮料量(ml)服 从正态分布 N ( 250,1.582 ), 若 P (x < l ) =0.05, P(x≥

    l2)=0.05,求 l,1 l2。

    1

    由题意可知,α/2=0.05,α=0.10 又因为
    x ? 250 l1 ? 250 P( x ? l1 ) ? P( ? ) ? P(u ? ?u? ) ? 0.05 1.58 1.58 P(x≥ l )= x ? 250 l2 ? 250 2 P( ? ) ? P(u ? u? ) ? 0.05 1.58 1.58 故 P(x< l )+ P(x≥ l 2 )
    1

    = P(u<- u ) + P(u≥
    ?

    u? )

    P(u<- u? + P(u≥ )
    =1- P(-

    u?)

    )=0.10=α u?≤u< u? =1.644854 , 所以
    0.10

    由附表2查得: u
    1

    ( l -250)/1.58=-1. 644854
    250)/1.58=1. 644854 即

    (

    l2 -

    l1

    ≈247.40, l ≈252.60。
    2

    对于二项分布,在n→∞,p→0, 且 n p =λ(较小常数)情况下 ,二项分布 趋于泊松 分布。 在n→∞, p→0.5时 , 二项分布趋于正态 分布。在这种场合 ,正态分布中的 μ、σ2用 二项分布的n p、n p q代之。 在实际计算中,当p<0.1且n 很大时 , 二项分布可由泊松分布近似;当p>0.1且n 很大时 ,二项分布可由正态分布近似。

    对于泊松分布,当λ→∞时 ,泊松分布 以正态分布为极限。在实际计算中, 当 λ≥20 ,用泊松分布中的λ代替正态分布中

    的μ及σ2 ,即可由后者对前者进行近似计算。

    第2节抽样分布
    2.1 样本平均数的抽样分布
    the relationship of Population and Sample
    2 aspects,

    First 是从总体到样本 ,抽样分布
    (sampling distribution) ; Second 是从样本到总体,这就是统计推断 (statistical inference) 。

    样本统计量(如 x,S)也将随样本的不同 而有所不同,因而样本统计量也是随机变量, 也有其概率分布。把统计量的概率分布称为 抽样分布。 Review Parameter : The eigenvalue are calculated by population . Statistics: The eigenvalue are calculated by sample.

    2.1 样本平均数抽样分布

    由总体随机抽样(random sampling)的方法可分为有返置抽样和 不返置抽样两种。

    上一张 下一张 主 页

    退 出

    设有一个总体 ,总体平均数为 μ,方差为σ2, 总体中各变数为 x, 将 此总体称为原总体。现从 这个总体中随机抽取含量为n的样本,样本平均 数记为 。 x
    从原总体中可抽出很多甚至无穷多个含量为 n的样本。由这些样本算得的平均数有大有小, 不尽相同,与原总体平均数μ相比往往表现出不 同程度的差异。这种差异是由随机抽样造成的 , 称为 抽样误差(sampling error)。 显然,样本平均数也是一个随机变量,其概 率分布叫做样本平均数的抽样分布。由样本平均 数构成的总体称为样本平均数的抽样总体。

    抽样总体平均数和标准差分别记为 ? x
    和? x。

    ? x 是样本平均数抽样总体的标准差,简
    称标准误差(standard error),它表示平均 数抽样误差的大小。统计学上已证明总体的

    两个参数与x 总体(样本总体)的两个参数
    有如下关系:
    ?
    n

    ? x =μ,

    ?x ?

    (3-19)

    设有一个 N=4 的 有限总体,变数为2、 3、3、4。根据μ=Σx/N和σ2=Σ(x-μ)2/ N求得该总体的μ、σ2、σ为: μ=3, σ2=1/2, σ= =0.707
    1 2

    表3-3 N=4, n=2和n=4时的次数分布

    从有限总体作返置随机抽样,所有可能的
    样本数为Nn其中n为样本含量 。以上述总体

    而论,如果从中抽取n=2的样本, 共可得
    42=16 个样本;如果样本含量n为4 ,则 一 共

    可 抽 得44=256个样本。分别求这些样本的平
    均数 x ,其次数分布如表3-3所示。

    根据表3-3,在n=2的试验中,样本平均数
    抽样总体的平均数、方差与标准差分别为:

    ? x ? ? f x / N ? 48.0 / 16 ? 3 ? ?
    n

    ? ?2 ?
    x

    f (x ? ? x )2 Nn

    ? ?

    fx 2 ? (? fx ) 2 / N n Nn

    148 ? 48 2 / 16 ? 16

    ? / n =4/16=1/4=(1/2)/2
    2

    ? x ? ? ? 1/ 4 ? 1 2 / 2 ? ?
    2 x

    n

    同理,可得n=4时:

    ? x ? 768 / 256 ? 3 ? ?
    2 ?x

    ? 32 / 256 ? 1 / 8 ? (1 / 2) / 4 ? ? / n
    2

    ?x ?

    1 ? 8

    1

    2

    4 ??

    n

    ? ? 这就验证了 x =μ, x ? ? / n 的正确性。
    若将表3-3中两个样本平均数的抽样总
    体作次数分布图,则如图3-10所示。

    1. 若 随 机 变 量 x 服 从 正 态 分 布 N(μσ2) ; x1 x 2 、…、 x n, 是由x 总体得来 、 的随机样本,则统计量 =Σx/n的概率分 x / 即 布也是正态分布, 且有 ? x =μ, ? x ? ? , n 服从正态分布N(μ,σ2/n)。
    2. 若随机变量x服从平均数是 μ,方差是 σ2的分布(不是正态分布); , ,…, x n x1 x 2 是由此总体得来的随机样本,则 统 计 量 x =Σx/n的概率分布,当n相当大时逼近正态 分布N(μ,σ2/n)。这就是中心极限定理。

    不论x变量是连续型还是离散型,也无 论x服从何种分布,一般只要n>30,就可 认为

    x 的分布是正态的。 若x的分布不很 偏倚,在n>20时 , 的分布就近似于正态 x
    分布了。

    2.2 均 数 标 准 误

    在实际工作中,总体标准差σ往往是未 知的,因而无法求得 ? x。此时,可用样本 标准差S估计σ。于是,以 S n 估计 ? x。记 为 S n, 称作样本标准误或均数标准误。 Sx Sx 样本标准误 是平均数抽样误差的估计 值。若样本中各观测值为 , ,…, , 则 x1 x x
    2

    n

    Sx ?

    S n

    ?

    ? (x ? x)
    n(n ? 1)

    2

    ?

    ?x

    2

    ? (? x) / n
    2

    (3-20)

    n(n ? 1)

    S& S x 的区别在于:

    样 本 标 准 差 S 是 反 映 样 本中(内) 各观测值 x x ,…, xk 变 异 程 度大小 , 1 2 的一个指标,它的大小说明了 x 对 该 样本 代表性的强弱。
    样本标准误是样本平均数 x1 , x2 ,..., xk的 标准差,它是 x 抽样误差的估计值,其大小 说明了样本间变异程度的大小及 x 精确性的高低。

    对于大样本资料,常将样本标准差S与
    样本平均数 x 配合使用,记为 x ±S,用以 说明所考察性状或指标的优良性与稳定性。

    对于小样本资料,常将样本标准误 S x
    与样本平均数 x 配合使用,记为 x ±S x , 用 以表示 所考察性状或指标的优良性与 抽

    样误差的大小。

    2.3 两样本均数差数的抽样分布
    Precondition 两样本的平均数相互独立,并且样 本平均数之差服从正态分布。两个总体 服从正态分布,n1,n2 表示样本容量。
    ? x1?x2 ? ?1 ? ? 2

    ? x ?x ?
    1 2

    ? 12
    n1

    ?

    ? 22
    n2

    (3-21)

    如果来自同一在正态总体,那么?1 ? ? 2 ? 1 ? ? 2

    ? x1?x2 ? 0

    ? x1?x2 ?

    ?2
    n1

    ?

    ?2
    n2

    ??

    1 1 ? n1 n2

    2.3 两样本均数差数的抽样分布
    若所有样本来自两个非正态总体,尤其 ? 和 ? 相差不大时,n1和n2趋于无穷 大时,均数差数的抽样分布趋于正态分 布,参数之间的关系同:
    2 2 2 1

    ? x1?x2 ? ?1 ? ? 2

    (3-21)
    2

    ? x ?x
    1

    2

    ?1 ? 2 ? ? n1 n 2
    2

    2.3 两样本均数的标准误(均数差 异标准差)? ,? 未知, 2 2 S1 S2 S x1?x2 ? ? n1 n2 如果各自总体方差等于? ? ? ? ?
    2 2 2 1

    2

    2 2

    2

    1

    ?s s
    2 0

    .df 1 ? 1

    2

    df 1 ? df 2

    s

    2

    .df 2 2

    SS 1 ? SS 2 ? x1 ? x1 ? ? x 2 ? x 2 ? ? n1 ? n 2 ? 2 n1 ? n 2 ? 2

    ?

    ? ?
    2

    ?

    2

    S x1? x2 ?

    1 ? ?1 ? ? ? ? n1 n 2 ?

    s

    2

    0

    2.3 两样本均数差数的抽样分布例题
    ? 例3-10

    设总体甲有3个变数{2,4,6}, 总体乙有两个变数{3,6},计算甲、乙 8 ? 两总体的均数个方差得到 ?1 ? 4 ? 3 9 ? 从总体甲中随机重复抽样, ? 2 ? 4.5 ? 4 每抽两个数组成一个样本,从总体乙中 随机重复抽样,每抽三个数组成一个样 本。计算样本均数差数的平均数和标准 差。
    2 1 2 2

    2.5 t 分 布
    当总体标准差σ未知时, 以样本标 准差S代替σ所得到的统计量 ( x ? ? ) / S x 记 为t。在计算 S时,由于采用S来代替σ, x 使得t 变量不再服从标准正态分布,而 是服从t分布(t-distribution)。

    上一张 下一张 主 页

    退 出

    t= ( x ? ? ) / S x (3-26)
    f (t ) ? ?[(df ? 1) / 2] t (1 ? ) ?(df / 2) df ?df 1
    2 ? df ?1 2

    (3-27)

    式中,t的取值范围是(-∞,+∞);
    df=n-1为自由度。 t分布的平均数和标准差 为: μt=0 (df>1),? t
    ? df /(df ? 2) (df>2)(3-28)

    t分布密度曲线如图3-11 所示,其特点是:

    1、t分布受自由度的制约,1个自由度对应1 条t分布密度曲线。 2、t分布密度曲线以t=0为对称轴,左右对称, 且在t=0时,分布密度函数取得最大值。 3、df越大,t分布越趋近于标准正态分布。 当n >30时,t分布与标准正态分布的区别很??; n >100时,t分布基本与标准正态分布相同; n→∞时,t 分布与标准正态分布完全一致。

    t分布的概率分布函数为:
    Ft ( df ) ? P (t ? t1 ) ?

    ??? f (t )dt

    t1

    (3-29)

    因而t在区间(t1,+∞)取值的概率-右 尾概率为1-F t (df)。由于t分布左右对称,t在 区间(-∞,-t1)取值的概率也为1-F t df)。 于是 t 分布 曲线 下由-∞到- t 1和由t 1到 +∞ 两 个 相 等 的 概 率 之和--两尾概率为 2(1-F t (df))。对于不同自由度下t分布的两尾 概率及其对应的临界t值已编制成附表3,即t 分布表。

    例如,当df=15时,查附表3得两尾概率等于0.05 的临界t值为 2.131,其意义是: P(-∞<t<-2.131)= P(2.131<t<+∞)

    =0.025;
    P(-∞<t<-2.131)+ (2.131<t<+∞) =0.05。 由附表3可知,当df一定时,概率P越大,临界t 值越??;概率P越小,临界t值越大 。当 概 率 P 一 定时,随着df的增加,临界t值在减小,当df=∞时, 临界t值与标准正态分布的临界u值相等。

    作业
    ? 书63页3,4题 ? 书64页8,9,10,11题


    推荐相关:

    第三章理论分布与抽样分布_图文.ppt

    第三章理论分布与抽样分布 - Section 3.1 二项分布 The Bino

    第3章理论分布与抽样分布_图文.ppt

    第3章理论分布与抽样分布 - 随机变量 做一次试验,其结果有多种可能。每一 种可

    第三章理论分布和抽样分布_图文.ppt

    第三章理论分布和抽样分布 - 文档均来自网络,如有侵权请联系我删除文档... 第三章 理论分布和抽样分布第一节:概率及其计算 概率论:研究随机现象规律性的科 学。 ...

    3 理论分布与抽样分布_图文.ppt

    3 理论分布与抽样分布 - 第三章 统计数据的理论分布与抽样分布 统计数据的理论分布与抽样分布---二项分布 重要的离散型分布 只有两种可能结果的随机试验称为...

    三、理论分布与抽样分布_图文.ppt

    三、理论分布与抽样分布 - 第三章 理论分布与抽样分布 ?事件与概率 ?正态分布

    第4章 理论分布和抽样分布3_图文.ppt

    第4章 理论分布和抽样分布3 - 目的与要求 1.了解随机事件、统计概率及其运算

    第三章 抽样与抽样分布_图文.ppt

    第三章 抽样与抽样分布 - 第 3 章 抽样与抽样分布 ? 3.1 常用的抽样方法 ? 3.2 抽样分布 ? 3.3 中心极限定理的应用 3.1 常用的抽样方法 一、简单随机...

    第三章概率、概率分布与抽样分布_图文.ppt

    第三章概率、概率分布与抽样分布 - 第三章 概率、概率分布与抽样分布 第一节 第

    第3章 抽样与抽样分布_图文.ppt

    第3章 抽样与抽样分布_理学_高等教育_教育专区。第3章 抽样与抽样分布 ...样本统计量的概率分布,是一种理论分布 ? 在重复选取容量为n的样本时,由该统计...

    第3章 概率概率分布与抽样分布_图文.ppt

    统计学 STATISTICS 第3章 概率、概率分布与抽样分布 3.1 3.2

    第3章概率及抽样分布_图文.ppt

    第3章概率及抽样分布 - 第3章 概率与抽样分布 Probability and

    -第3章概率与抽样分布_图文.ppt

    -第3章概率与抽样分布 - 文档均来自网络,如有侵权请联系我删除文档... -第3章概率与抽样分布_数学_自然科学_专业...? 密度曲线可视为是观察变量的理论分布图 形...

    (03)第3章 抽样与抽样分布(袁卫)_图文.ppt

    (03)第3章 抽样与抽样分布(袁卫)_数学_自然科学_专业资料。第 3 章 抽样与...样本统计量的概率分布,是一种理论分布 ? 在重复选取容量为n的样本时,由该统计...

    第3章_抽样与抽样分布_图文.ppt

    第3章_抽样与抽样分布 - 第三章 抽样与抽样分布 引例: 为进一步调查三聚氰胺

    统计学第3章抽样与抽样分布_图文.ppt

    统计学第3章抽样与抽样分布 - 第 3 章 抽样与抽样分布 3.1 常用的抽样方

    第三章理论分布与抽样分布_图文.ppt

    第三章理论分布与抽样分布 - 第三章 理论分布与抽样分布 第一节 概率-频率的稳

    第3章概率与抽样分布-_图文.ppt

    第3章概率与抽样分布- - 第3章 概率与抽样分布 Probability an

    统计学第3章 概率分布与抽样分布_图文.ppt

    统计学第3章 概率分布与抽样分布_教育学_高等教育_教育专区。统计学 STATISTICS...样本统计量的概率分布,是一种理论分布 ? 在重复选取容量为n的样本时,由该统计...

    理论分布和抽样分布_图文.ppt

    理论分布和抽样分布 - 第四章 理论分布和抽样分布 第一节 事件、概率和随机变量 第二节 二项式分布 第三节 正态分布 第四节 抽样分布 第一节 事件、概率和...

    第3章 抽样与抽样分布_图文.ppt

    形 态 抽样分布样本统计量服从的分布(如 样本均值、样本成数、样本方差的抽样分 布等),是一种理论概率分布 4 - 17 STATISTICS 统计学 1、什么是抽样分布...

    北京十一选五开奖结果 | 北京十一选五开奖结果
    All rights reserved Powered by 北京十一选五开奖结果 北京十一选五开奖结果 www.frdg.net
    copyright ©right 2010-2021。
    文档资料库内容来自网络,如有侵犯请联系客服。[email protected]
  • 广州市白云区人民法院公告专栏 2019-08-20
  • 北京:十二届市委启动第四轮巡视 2019-08-14
  • 单眼皮泡泡眼女生看过来,你的眼妆应该要这样化! 2019-08-14
  • 杨木森:梦想从这里远航 2019-08-03
  • 澳大利亚施压太平洋岛国搅黄中企商业项目后 竟自己承包了 2019-08-03
  • 十年整装再出发 东阳红木家具市场现代家居生活馆深耕新中式 2019-07-30
  • 进口车调价大比拼 谁家才是真“厚道” 2019-07-30
  • 地铁车厢人来人往的空间内,聚集着参差百态的灵魂 2019-07-15
  • 2018 Yorkville Exotic Car Show kicks off in Toronto - Culture News - CQNEWS 2019-06-25
  • 首付贷等违规行为料再遭“严打” 2019-06-25
  • 母亲节丨童言无忌 幼儿园的“10后”们想对妈妈说.... 2019-06-24
  • 落户新政后天津楼市突变 每平米房价一夜之间涨了两三千 ——凤凰网房产北京 2019-06-23
  • 49只“神话之鸟”中华凤头燕鸥返回象山韭山列岛 2019-06-10
  • 银保监会新规剑指大企业多头融资和过度融资 2019-06-09
  • Gucci正式和LV宣战:我们要成为最大的奢侈品品牌 2019-05-21
  • 排列三预测千里马 江苏快3是正规彩票吗 福建十一选五走势图爱采乐 围棋界张秉伦 广西十一选五绝招 3d福彩开奖号 ag真人娱乐造假 六肖中特期期准免费香港 体育彩票走势图 香港赛马会 徽章 山东时时彩计划 15选五开奖结果走势图 百度 排列三绝杀一码专家 刘伯温四肖中特了百度 欢乐生肖一期一计划