【概述】
统计推断的两大基本问题,一类是估计问题,另一类即假设检验问题
在总体的分布函数完全未知或只知其形式,但不知其参数的情况下,为推断总体的某些未知特性,提出某些关于总体的假设,例如提出总体服从泊松分布的假设,又如正态总体提出数学期望等于
需要的根据样本对所提出的假设作出接受还是拒绝的决策,作出决策的这一过程,即假设检验
简单来说,假设检验就是先对总体参数提出一个假设值,然后利用样本信息来判断这一假设是否成立
处理参数的假设检验问题步骤如下:
- 根据实际问题,提出原假设
与备择假设 - 给定显著性水平
与样本容量 - 确定检验统计量与拒绝域形式
- 按
求出拒绝域 - 取样,根据样本观察值作出决策,是接受
还是拒绝
【原假设与备择假设】
在假设检验时,通常会设置两个互斥的假设:
- 原假设
:一般是想要拒绝的假设,其设置一般为 - 备择假设
:一般是想要接受的假设,其设置一般为
例如:某车间用一台包装机包装葡萄糖,袋装糖的净重是一个随机变量,其服从正态分布,当机器正常时,其均值为
问该机器是否正常?
以
问题是根据样本值来判断
然后,给出一个合理的法则,根据这一法则,利用已知样本作出决策是接受
如果作出的决策是接受
【两类错误与显著性检验】
通过样本数据来判断总体参数的假设是否成立,但样本是随机的,因而有可能出现小概率的错误,这种错误分两种:
- 弃真错误(第 Ⅰ 类错误、
错误):原假设实际上是真的,但通过样本估计总体后,拒绝了原假设 - 取伪错误(第 Ⅱ 类错误、
错误):原假设实际上是假的,但通过样本估计总体后,接受了原假设
对于弃真错误来说,将这中错误的概率记为
这个
同理,对于取伪错误来说,有:
这也是原假设一般都是想要拒绝的假设的原因,因为原假设被拒绝,如果出错的话,只会犯弃真错误,而犯弃真错误的概率已经被规定的显著性水平所控制了,这样对统计者来说更容易控制,将错误影响降到最小
在确定检验法则时,应尽可能使犯两类错误的概率都较小,但一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往增大,若要使犯两类错误的概率都减小,除非增加样本容量
在给定样本容量的情况下,一般来说,总是控制犯第 Ⅰ 类错误的概率,使它不大于
这种只对犯第 Ⅰ 类错误的概率加以控制,而不考虑犯第 Ⅱ 类错误的概率的检验,称为显著性检验
接上例,在给出原假设
由于
同时,考虑到当
为确定常数
由于当
因而,若检验统计量
此时
在本例中,若给出显著性水平
于是拒绝
【拒绝域与临界点】
当检验统计量取某个区域
在上例中,拒绝域为:
临界点为:
【双边检验与单边检验】
形如上例中的备择假设
而形如
的假设检验,称为右边检验
类似的,形如
的假设检验,称为左边检验
右边检验和左边检验,统称为单边检验
Be the first person to leave a comment!