解放军文职招聘考试第五讲 样本及抽样分布
第五讲 样本及抽样分布
一 基本概念
总体 含义1:研究对象的全体,例如一批灯泡。
含义2:研究对象的某数量指标(例如灯泡的寿命,随机变量)X的取值全体,总体的分布是指随机变量X的分布。
个体 组成总体的某个基本单元,例如一个个的灯泡,也指基本单元的数量指标。
样本 从总体中抽取的n个个体,n又称样本容量。
简单随机样本 样本中的n个个体相互独立,且与总体同分布的样本,简称样本。样本的实验结果称为样本观测值。
样本空间 样本的所能可能结果。
统计量 样本的不含任何参数的函数。
二 重要统计量
样本均值 (而称为样本均值的观测值)
样本方差
注:
一 基本概念
总体 含义1:研究对象的全体,例如一批灯泡。
含义2:研究对象的某数量指标(例如灯泡的寿命,随机变量)X的取值全体,总体的分布是指随机变量X的分布。
个体 组成总体的某个基本单元,例如一个个的灯泡,也指基本单元的数量指标。
样本 从总体中抽取的n个个体,n又称样本容量。
简单随机样本 样本中的n个个体相互独立,且与总体同分布的样本,简称样本。样本的实验结果称为样本观测值。
样本空间 样本的所能可能结果。
统计量 样本的不含任何参数的函数。
二 重要统计量
样本均值 (而称为样本均值的观测值)
样本方差
注:
三、抽样分布
统计量的分布:大多数情况下,针对正态分布样本而言,以下不说明均指正态分布。
1、分布: 如果r.v X的密度函数为
则称X服从参数为n的分布,记作又称自由度,指独立变量的个数。如果,则。
定理5.1 如果,则
与独立。
例5.1 (993) 天平上重复称量重量为a的物品,每次称量结果独立同服从正态分布N(),若以表示n次称量的算术平均,则为使
n的最小值应不小于自然数 16 。
解:因为,故
,
。
例5.2 已知且
求a,b。
解:
同理
例5.3 (983) 是N (0,)的样本,
则a=,b= 时分布,自由度为2
统计量的分布:大多数情况下,针对正态分布样本而言,以下不说明均指正态分布。
1、分布: 如果r.v X的密度函数为
则称X服从参数为n的分布,记作又称自由度,指独立变量的个数。如果,则。
定理5.1 如果,则
与独立。
例5.1 (993) 天平上重复称量重量为a的物品,每次称量结果独立同服从正态分布N(),若以表示n次称量的算术平均,则为使
n的最小值应不小于自然数 16 。
解:因为,故
,
。
例5.2 已知且
求a,b。
解:
同理
例5.3 (983) 是N (0,)的样本,
则a=,b= 时分布,自由度为2
例5.4设总体X服从正态分布,从该总体中抽取简单随机样本
,其样本均值为,
求统计量的数学期望E(Y)。
解:,故
2、t-分布 如果与相互独立,则称
服从自由度(参数)为n的t-分布,记作t (n)。
定理5.2 如果则
证明:
由t-分布的定义知
例5.5 (97.4)已知则统计量
服从分布,参数为9。
解:因为
由t-分布的定义知
例5.6 (944) 设,
,
例5.6 (944) 设,
,
(A) (B)
(C) (D)
则服从t (n-1)的随机变量是(B)。
注:(C)、(D)的分布自由度为n ,题中条件自由度为n-1,而(A)不符合定理2结论。
例5.7(993)是正态总体样本,
(C) (D)
则服从t (n-1)的随机变量是(B)。
注:(C)、(D)的分布自由度为n ,题中条件自由度为n-1,而(A)不符合定理2结论。
例5.7(993)是正态总体样本,
证明Z ~ t (2 )
证:设,则,
且三者相互独立,与S2独立。
练习:1)设已知,则统计量
服从 (t) 分布,参数为 n 。
2)设,,
,,求a = 。
3、F-分布 设与相互独立,则
称为服从第一自由度为n第二自由度为m的F-分布。
定理5.3 设与
相互独立,则
例5.8 (013) 则统计量
~
分位数:(连续型)设有r.v ,对于满足的称为r.v 的上侧a
分位数,显然对于标准正态分布的上侧a分位数而言,。类似地可
以定义的下侧a分位数,即若则称为r.v 的下侧a分位数。
显然和间满足,并且对于正态分布和t分布,由于它们是对称的,
故。因此列分位数表时,一般正态分布和t分布(用表示t分布的上
侧a分位数)只给出上侧a分位数表;而对于F-分布,由于有关系式
,也只须给出上侧a分位数表:但对于分布,没有这些性质,必须同时给出与。
注:实际计算时,可令,相应的自由度记为,这时
可避免查下侧分位数。
可加性:二项分布、泊松分布、正态分布和分布具有可加性。
第六讲 参数估计
一、矩估计
若统计量T作为总体参数(或g( ))的估计时,T就称为(或g( ))的估计量。
定义6.1矩估计量 设是总体X的样本,X的分布函数 依赖于参数,假定X的r阶矩为
(或r阶中心矩)相应的样本矩记为 如下的k个议程
(6.1)
的解,称为未知参数的矩估计。
例6.1 (971) 设总体X的密度是未知参数,是总体X的样本,求的矩估计。
解:总体只有一个未知参数,只须建立一个(一阶矩)方程式
建立方程
例6.2 设是总体的样本,求a,b的矩估计。
解:总体有两个未知参数,须建立两个方程。由于
服从 (t) 分布,参数为 n 。
2)设,,
,,求a = 。
3、F-分布 设与相互独立,则
称为服从第一自由度为n第二自由度为m的F-分布。
定理5.3 设与
相互独立,则
例5.8 (013) 则统计量
~
分位数:(连续型)设有r.v ,对于满足的称为r.v 的上侧a
分位数,显然对于标准正态分布的上侧a分位数而言,。类似地可
以定义的下侧a分位数,即若则称为r.v 的下侧a分位数。
显然和间满足,并且对于正态分布和t分布,由于它们是对称的,
故。因此列分位数表时,一般正态分布和t分布(用表示t分布的上
侧a分位数)只给出上侧a分位数表;而对于F-分布,由于有关系式
,也只须给出上侧a分位数表:但对于分布,没有这些性质,必须同时给出与。
注:实际计算时,可令,相应的自由度记为,这时
可避免查下侧分位数。
可加性:二项分布、泊松分布、正态分布和分布具有可加性。
第六讲 参数估计
一、矩估计
若统计量T作为总体参数(或g( ))的估计时,T就称为(或g( ))的估计量。
定义6.1矩估计量 设是总体X的样本,X的分布函数 依赖于参数,假定X的r阶矩为
(或r阶中心矩)相应的样本矩记为 如下的k个议程
(6.1)
的解,称为未知参数的矩估计。
例6.1 (971) 设总体X的密度是未知参数,是总体X的样本,求的矩估计。
解:总体只有一个未知参数,只须建立一个(一阶矩)方程式
建立方程
例6.2 设是总体的样本,求a,b的矩估计。
解:总体有两个未知参数,须建立两个方程。由于
练习:设。
二、最(极)大似然估计
设总体X的密度函数是参数或参数向量,是该总体的样本,对给定的一组观测值,其联合密度是的函数,又称似然函数,记为:
其中为参数集,若存在 使就称
是的最大似然估计值,而是的最大似然估计量。
注:1)对给定的观测值,是的函数,最大似然估计的原理是选择使观测值出现的“概率”达到最大的作为的估计。
2)最大似然估计具有不变性,即若是的最大似然估计,则的最大似然估计为。但是,矩估计不具有不变性,例如假定的矩估计,一般情形下,的矩估计不是。
例6.3 设总体X具有有是已知的正整数,求未知参数的最大似然估计。
解:对给定的观测值,其似然函数为:
当时,对数似函数为:
(6.3)
令
的最大似然估计量为。
注:在(6.3)式中,对求偏导数与无关的量均归为常数。
例6.4 的最大似然估计量。
解:
又因为的最大似然估计量分别为根据极大似然估计的不变性,可知p的极大似然估计量为。
例6.5 设的极大似然估计。
解:总体密度为时。故对于样本观测值,似然函数为
如果的估计取得过大,将变小(因为分母变大),如果取得太小,某,这时故的极大似然估计值为极大似然估计量为
例6.6 某单位有M辆自行车,编号为,假定职工存取自行车是随机的,有人连续观测了几天,将其第i天看到的第一辆车的牌号记为,求M的极大似然估计量。
解:设总体X表示每天存取的牌号,X取值,由于存取车是随机的,故其分布列为。这可以视为离散型均匀分布,同上题分析知M的极大似然估计量为
例6.7 设某种元件的寿命,其中是未知参数,
又设是X的一组观测值,求的最大似然估计值.
解:似然函数
对数似然函数
,
是的单调增加函数,越大越大,但如果大于某,则其值=0,故时达到最大.
三、估计量的优良性质:
以下假定的估计量(对的估计量也成立)
无偏性:
一致性:。
注:一致估计具有不变性,即若的一致估计量,的函数,则的一致估计量。
例6.8 设是总体X的样本,
则 (C)
(A)S是的无偏估计量. (B)S是的最大似然估计量.
(C)S是的一致估计量. (D) S与相互独立的.
解:的无偏估计量,无偏估计不具有不变性,因此一般情况下S不是的无偏估计量;尽管最大似然估计具有不变性,但一般情况下的最大似然估计量是一致估计具有不变性,故(C)成立;在正态分布情况下
相互独立。
例6.5续: 是否为的无偏估计(或是否具有无偏性),是否为的一致估计。
解:当时
当时
而的无偏估计。
对给定的
二、最(极)大似然估计
设总体X的密度函数是参数或参数向量,是该总体的样本,对给定的一组观测值,其联合密度是的函数,又称似然函数,记为:
其中为参数集,若存在 使就称
是的最大似然估计值,而是的最大似然估计量。
注:1)对给定的观测值,是的函数,最大似然估计的原理是选择使观测值出现的“概率”达到最大的作为的估计。
2)最大似然估计具有不变性,即若是的最大似然估计,则的最大似然估计为。但是,矩估计不具有不变性,例如假定的矩估计,一般情形下,的矩估计不是。
例6.3 设总体X具有有是已知的正整数,求未知参数的最大似然估计。
解:对给定的观测值,其似然函数为:
当时,对数似函数为:
(6.3)
令
的最大似然估计量为。
注:在(6.3)式中,对求偏导数与无关的量均归为常数。
例6.4 的最大似然估计量。
解:
又因为的最大似然估计量分别为根据极大似然估计的不变性,可知p的极大似然估计量为。
例6.5 设的极大似然估计。
解:总体密度为时。故对于样本观测值,似然函数为
如果的估计取得过大,将变小(因为分母变大),如果取得太小,某,这时故的极大似然估计值为极大似然估计量为
例6.6 某单位有M辆自行车,编号为,假定职工存取自行车是随机的,有人连续观测了几天,将其第i天看到的第一辆车的牌号记为,求M的极大似然估计量。
解:设总体X表示每天存取的牌号,X取值,由于存取车是随机的,故其分布列为。这可以视为离散型均匀分布,同上题分析知M的极大似然估计量为
例6.7 设某种元件的寿命,其中是未知参数,
又设是X的一组观测值,求的最大似然估计值.
解:似然函数
对数似然函数
,
是的单调增加函数,越大越大,但如果大于某,则其值=0,故时达到最大.
三、估计量的优良性质:
以下假定的估计量(对的估计量也成立)
无偏性:
一致性:。
注:一致估计具有不变性,即若的一致估计量,的函数,则的一致估计量。
例6.8 设是总体X的样本,
则 (C)
(A)S是的无偏估计量. (B)S是的最大似然估计量.
(C)S是的一致估计量. (D) S与相互独立的.
解:的无偏估计量,无偏估计不具有不变性,因此一般情况下S不是的无偏估计量;尽管最大似然估计具有不变性,但一般情况下的最大似然估计量是一致估计具有不变性,故(C)成立;在正态分布情况下
相互独立。
例6.5续: 是否为的无偏估计(或是否具有无偏性),是否为的一致估计。
解:当时
当时
而的无偏估计。
对给定的
故的一致估计。
有效性:的无偏估计,若,称较有效。
例6.9设从均值为,方差为的总体中分别抽取容量为的两个独立样本,样本均值分别记为,试证对于任意满足的常数。的无偏估计,并确定常数,使T的方差达到最小。
解:即的无
偏估计量,又而令
故处达到最小值,即使T的方差达到最小。
二、区间估计
设是总体X的样本,总体参数为对给定的
,若统计量,满足,就称随机
区间的置信度为的置信区间(区间估计)。
具体做法:构造样本的函数,其中的分布与无关,选择
使
再将上式转换成即可。
例6.10 求的置信度为的置信区间,如果取得如下观测值:1.8,2.1,2.0,2.2,1.9,2.2,1.8,求的区间估计值。
解:先考虑的区间估计,构造一个随机变量且,且其分布易求。
,
但上式还含有其他参数(称为讨厌参数),当已知为,的的置信区间为,在(934略)中,得到的的区间估计值为 [4.804,5.196]。
当未知时,用s代替,就有,r.v
其中,于是由t-分布的对称性。
对于,由于
故由分布的非对称性
故由分布的非对称性
对于本例,给定的样本观测值算得
,
,
故的区间估计值为:
的区间估计值为:
例6.11 (003) 假定0.5, 1.25, 0.8, 2.0是总体X的样本值,已知,
(1)求;(2)求的0.95置信区间;(3)b的0.95置信区间。
解:(1),
,
,
故的区间估计值为:
的区间估计值为:
例6.11 (003) 假定0.5, 1.25, 0.8, 2.0是总体X的样本值,已知,
(1)求;(2)求的0.95置信区间;(3)b的0.95置信区间。
解:(1),
(2),故,于是
, (1)
的95%置信区间为,
由观测值算的,故
的95%置信区间为。
(3)由的严格递增值,及(1)知
故由的95%置信区间为。
第七讲 假 设 检 验
统计假设:对总体的分布形式或分布中的某些参数所作的某种假设。
检验:由样本构造合适的统计量,对统计假设正确与否所作的判断。
一、基本概念:
1、假设检验的一般步骤:
1)将实际问题转化成统计假设检验问题。提出原假设 与备选假设
注:如果,那么意味,意味且
2)构造合适的统计量
3)导出统计量的分布,对给定的显著水平,确定拒绝域
4)根据样本观测值,计算统计量的值,判断是否落在拒绝域内,并对实际问题作出问答。
2、检验类型:单边检验与双边检验;一个总体与两总体检验;均值与方差检验。
3、两类错误。
二、应用举例
例7.1 某味精厂生产的味精每袋重X(克)服从,根据要求每袋重100
克,由以往生产经验知X的均方差为基本稳定,现从某天包装的味精中随机
抽取9袋,测得它们的重为99.3,98.7,100.5,101.2,99.3,99.7,99.5,102.1,100.5,
试问这天包装的味精是否合格?
解:是正态总体参数的假设检验问题,方差已知,参数将
分成两部对应了实际问题中的包装合格与不合格(双边检验问题),即
(包括)含等号的为原假设,于是
由于方差已知,用统计量,即取=0.05
检验:由样本构造合适的统计量,对统计假设正确与否所作的判断。
一、基本概念:
1、假设检验的一般步骤:
1)将实际问题转化成统计假设检验问题。提出原假设 与备选假设
注:如果,那么意味,意味且
2)构造合适的统计量
3)导出统计量的分布,对给定的显著水平,确定拒绝域
4)根据样本观测值,计算统计量的值,判断是否落在拒绝域内,并对实际问题作出问答。
2、检验类型:单边检验与双边检验;一个总体与两总体检验;均值与方差检验。
3、两类错误。
二、应用举例
例7.1 某味精厂生产的味精每袋重X(克)服从,根据要求每袋重100
克,由以往生产经验知X的均方差为基本稳定,现从某天包装的味精中随机
抽取9袋,测得它们的重为99.3,98.7,100.5,101.2,99.3,99.7,99.5,102.1,100.5,
试问这天包装的味精是否合格?
解:是正态总体参数的假设检验问题,方差已知,参数将
分成两部对应了实际问题中的包装合格与不合格(双边检验问题),即
(包括)含等号的为原假设,于是
由于方差已知,用统计量,即取=0.05
拒绝域,经计算,
接受原假设,认为包装机正常,包装合格。
例7.2 灯泡的使用寿命服从分布,假定灯泡的额定寿命是960小时,从某批生产者的灯泡中随机抽验了10只,测得寿命为:
950,960,960,950,950,960,940,970,950,960
试问这批灯泡是否合格()?
解:这是一个正态总体,方差未知,均值的单边假设检验问题,灯泡合格对应了
,灯泡不合格对应了,于是
其中
拒绝域,临界值
由观测值算得 原假设成立,这批灯泡合格。
例7.3 某化工厂为了提高某种化学药品的得率,提出了两种工艺方案,为了研究哪一种方案好,分别用两种工艺各进行了10次试验,数据如下:
接受原假设,认为包装机正常,包装合格。
例7.2 灯泡的使用寿命服从分布,假定灯泡的额定寿命是960小时,从某批生产者的灯泡中随机抽验了10只,测得寿命为:
950,960,960,950,950,960,940,970,950,960
试问这批灯泡是否合格()?
解:这是一个正态总体,方差未知,均值的单边假设检验问题,灯泡合格对应了
,灯泡不合格对应了,于是
其中
拒绝域,临界值
由观测值算得 原假设成立,这批灯泡合格。
例7.3 某化工厂为了提高某种化学药品的得率,提出了两种工艺方案,为了研究哪一种方案好,分别用两种工艺各进行了10次试验,数据如下:
假设得率分别服从,问方案乙是否比方案甲显著提高得率?(取=0.01)
解:这是两个正态总体均值的检验问题。有显著提高:,无显著提高(单边检验)。
对于两个正态总体均值的检验,大纲只给出两总体方差相等时的检验问题,故可以先进行方差相等的(双边)检验。
,
,
而:
接受原假设,即:
再检验(单边)假设:
查表: 拒绝域 而
拒绝原假设,认为,乙方案的结果显著提高。
注:两正态总体方差未知,但相等的检验统计量:
独立,为比较的差
的差衡量,
故
又
从而
解:这是两个正态总体均值的检验问题。有显著提高:,无显著提高(单边检验)。
对于两个正态总体均值的检验,大纲只给出两总体方差相等时的检验问题,故可以先进行方差相等的(双边)检验。
,
,
而:
接受原假设,即:
再检验(单边)假设:
查表: 拒绝域 而
拒绝原假设,认为,乙方案的结果显著提高。
注:两正态总体方差未知,但相等的检验统计量:
独立,为比较的差
的差衡量,
故
又
从而
如本例给出两总体的具体观测值,且,这时可令
从而
检验统计量
其中,这就避开了检验方差是否相等的检验。
编辑推荐:
下载Word文档
温馨提示:因考试政策、内容不断变化与调整,长理培训网站提供的以上信息仅供参考,如有异议,请考生以权威部门公布的内容为准! (责任编辑:长理培训)
点击加载更多评论>>