Bootstrap

【抽样技术】CH2 简单随机抽样

目录

前言

一、定义

二、概述

1.总体

2.单元

3.抽样比

4.样本抽取原则

5.在抽样理论中的地位与作用

三、参数估计

1.参数表示

2.对总体特征的估计思路

3.对总体均值的估计

(1)引理

 (2)对总体均值的估计

4.方差和协方差的估计

5.区间估计

6.样本量的确定

(1)费用

(2)步骤

(3)精度(​编辑 ​编辑 ​编辑)

(4)估计总体均值时样本量的确定方法

 7.对总体比例的估计

(1)总体比例的估计量

(2)总体比例估计量的方差

(3)估计总体比例时样本量的确定

8.总体总值的简单估计

(1)总体总值的简单估计

(2)总体总值简单估计量的性质

(3)估计总体总值时估计量的确定

9.放回简单随机抽样的估计

10.设计效应( )

(1)定义

(2)的作用

(3)设计效应和样本量的确定

四、附表——抽样理论&数理统计的比较


前言

        学习一种抽样方法必须掌握的五个要点:

  • 该抽样方法的定义
  • 实施抽样的方法
  • 利用该抽样方法所得数据进行参数估计的方法
  • 估计量的性质:期望、方差
  • 估计量方差(精度)的估计方法

一、定义

1.从总体的gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20N个单元中,一次整批抽取gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20n个单元,使任何一个单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概率也都相等,这种抽样成为简单随机抽样(s.r.s)

2.从总体的gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20N个单元中,逐个不放回地抽取单元,每次抽到尚未入样的任何一个单元的概率都相等,直到抽足gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20n个单元为止,这样所得的gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20n个单元组成一个简单随机样本。(现实中采用的方法)

【注】

  • 对于简单随机抽样,依次抽到一组特定样本单元的概率为:

gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20P%28%20y_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%2C%20y_%7B2%7D%3DY_%7Bi_%7B2%7D%7D%2C%5Ccdots%20%2C%20y_%7Bn%7D%3DY_%7Bi_%7Bn%7D%7D%29%3D%5Cfrac%7B%28N-n%29%21%7D%7BN%21%7D

gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20proof%3A

gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%7B%5Ccolor%7BBlue%7D%20%7DP%28y_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%2Cy_%7B2%7D%3DY_%7Bi_%7B2%7D%7D%2C%5Ccdots%20%2Cy_%7Bn%7D%3DY_%7Bi_%7Bn%7D%7D%29%3DP%28y_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%29P%28y_%7B2%7D%3DY_%7Bi_%7B2%7D%7D%7Cy_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%29%5Ccdots%20P%28y_%7Bn%7D%3DY_%7Bi_%7Bn%7D%7D%7Cy_%7B1%7D%3DY_%7Bi_%7B1%7D%2C%5Ccdots%20%2Cy_%7Bn-1%7D%3DY_%7Bi_%7Bn-1%7D%7D%7D%29%3D%5Cfrac%7B1%7D%7BN%7D*%5Cfrac%7B1%7D%7BN-1%7D*%5Ccdots%20*%5Cfrac%7B1%7D%7BN-n+1%7D%3D%5Cfrac%7B%28N-n%29%21%7D%7BN%21%7D

之前课本中gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20X%2CYgif.latex?%5Cdpi%7B100%7D%20%5Csmall%20r.vgif.latex?%5Cdpi%7B100%7D%20%5Csmall%20x%2Cy为其具体值(非随机);在抽样课程中,gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20X%2CY为总体真值(非随机),gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20x%2Cy为样本值,是gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20r.v.。前面提到的gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cbinom%7BN%7D%7Bn%7D一般较大,若从gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cbinom%7BN%7D%7Bn%7D种可能的样本中随机抽取一种,需要先列出所有可能的gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cbinom%7BN%7D%7Bn%7D种样本,不现实。 

  • 不考虑顺序,则抽中一组特定样本的概率为:

gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cfrac%7B%28N-n%29%21%7D%7BN%21%7Dn%21%3D%5Cfrac%7B1%7D%7BC_%7BN%7D%5E%7Bn%7D%7D

  • 对于样本量n=1和n=2两种特殊情形(N个总体单元中抽取n个样本单元的简单随机抽样)

gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20P%28%20y_%7Bk%7D%3DY_%7Bs%7D%29%3D%5Cfrac%7B1%7D%7BN%7D%2CP%28%20y_%7Bk%7D%3DY_%7Bs%7D%2C%20y_%7Bj%7D%3DY_%7Bt%7D%29%3D%5Cfrac%7B1%7D%7BN%28N-1%29%7D

gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20k%2Cj%3D1%2C%5Ccdots%20%2Cngif.latex?%5Cdpi%7B100%7D%20%5Csmall%20s%2Ct%3D1%2C%5Ccdots%20%2CN%2Ck%5Cneq%20j%2Cs%5Cneq%20t

gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%7B%5Ccolor%7BBlue%7Dproof%3A%20%7D

gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%7B%5Ccolor%7BBlue%7D%20P%28y_%7Bk%7D%3DY_%7Bs%7D%29%3D%5Csum_%7Ball%28i_%7B1%7D%2C%5Ccdots%20%2Ci_%7Bn%7D%29%2Cbut%2Ci_%7Bk%7D%3Ds%7DP%28y_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%2C%5Ccdots%20%2Cy_%7Bn%7D%3DY_%7Bi_%7Bn%7D%7D%29%3D%5Cfrac%7B%28N-n%29%21%7D%7BN%21%7D%5Cbinom%7BN-1%7D%7Bn-1%7D%28n-1%29%21%3D%5Cfrac%7B1%7D%7BN%7D%7D

gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%7B%5Ccolor%7BBlue%7D%20P%28y_%7Bk%7D%3DY_%7Bs%7D%2Cy_%7Bj%7D%3DY_%7Bt%7D%29%3D%5Csum_%7Ball%28i_%7B1%7D%2C%5Ccdots%20%2Ci_%7Bn%7D%29%2Cbut%2Ci_%7Bk%7D%3Ds%2Ci_%7Bj%7D%3Dt%7DP%28y_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%2C%5Ccdots%20%2Cy_%7Bn%7D%3DY_%7Bi_%7Bn%7D%7D%29%3D%5Cfrac%7B%28N-n%29%21%7D%7BN%21%7D%5Cbinom%7BN-2%7D%7Bn-2%7D%28n-2%29%21%3D%5Cfrac%7B1%7D%7BN%28N-1%29%7D%7D

不计第几次抽样,抽中某特定单元的概率相等,都为gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cfrac%7B1%7D%7BN%7D

二、概述

1.总体

  • 具体总体
  • 有限总体
  • 与抽样框存在一一对应关系的实际调查总体

2.单元

        构成抽样总体的抽样单元并不总是等同于个体,个体是不可再分的单元,抽样单元可能包含很多个体。

3.抽样比

        样本容量gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20n相对于总体规模gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20N的比例gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20f%3D%5Cfrac%7Bn%7D%7BN%7D

4.样本抽取原则

  • 排除主观因素,按随机原则取样
  • 每个抽样单元被抽中的概率都是已知或事先可以计算的
  • 总体各单元的入样概率相等
  • 对于不放回抽样,总体各单元的入样概率之和等于样本量gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20n

5.在抽样理论中的地位与作用

优点:

  • 简单直观、理论成熟
  • 抽样调查的基础

缺点:

  • N很大时难以获得抽样框
  • 样本分散时不易实施
  • 很少单独使用,除非没有其他信息(常结合其他抽样方法使用)

三、参数估计

1.参数表示

总体真值 样本值
gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cbar%7BY%7D%3D%5Cfrac%7B1%7D%7BN%7D%5Csum_%7Bi%3D1%7D%5E%7BN%7DY_%7Bi%7D%3D%5Cfrac%7BY_%7B1%7D+Y_%7B2%7D+%5Ccdots%20%2CY_%7BN%7D%7D%7BN%7D gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cbar%7By%7D%3D%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7Dy_%7Bi%7D%3D%5Cfrac%7By_%7B1%7D+y_%7B2%7D+%5Ccdots%20%2Cy_%7Bn%7D%7D%7Bn%7D
gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20Y%3D%5Csum_%7Bi%3D1%7D%5E%7BN%7DY_%7Bi%7D%3DY_%7B1%7D+Y_%7B2%7D+%5Ccdots%20+Y_%7BN%7D gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20y%3D%5Csum_%7Bi%3D1%7D%5E%7Bn%7Dy_%7Bi%7D%3Dy_%7B1%7D+y_%7B2%7D+%5Ccdots+%20y_%7Bn%7D

gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20P%3D%5Cfrac%7BA%7D%7BN%7D%3D%5Cfrac%7B1%7D%7BN%7D%5Csum_%7Bi%3D1%7D%5E%7BN%7DY_%7Bi%7D

示性变量gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20Y_%7B1%7D%3D0gif.latex?%5Cdpi%7B100%7D%20%5Csmall%201(当gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20Y_%7Bi%7D符合条件时取值为1)

1
;