Bootstrap

数学建模 --- 皮尔逊相关系数假设检验的条件

皮尔逊相关系数假设检验条件

如果数据不为正态分布,则不可以使用皮尔逊相关系数
在这里插入图片描述
如何检验数据是正态分布?

检验数据是正态分布

1. 正态分布JB检验(大样本 n>30)

在这里插入图片描述

  • 原假设: 随机变量是服从正态分布
  • 备选假设: 不服从

这里的 p 与 0.05 比 较 p与0.05比较 p0.05是:假设置信水平是 95 % 95\% 95%,所以显著性水平是 1 − 0.95 = 0.05 1-0.95 = 0.05 10.95=0.05

  • p < 显 著 性 水 平 p<显著性水平 p< ⇔ \Leftrightarrow P 值 < 显 著 性 水 平 P值<显著性水平 P<, 则拒绝原假设
S = skewness(x)  % 偏度
K = kurtosis(x)  % 峰度
  • 此处的x必须为一个向量
JB检验的代码

要求样本量大于30

[h,p] = jbtext(x,alpha)
  • h = 1 h = 1 h=1 : 拒绝原假设; h = 0 h = 0 h=0:不能拒绝原假设
  • x:检验的随机变量 — 必须为向量
  • alpha: 代表显著性水平
  • p:代表概率论与数理统计中的P值
2. Shapiro-wilk夏皮洛-威尔克检验(小样本3<=n<=50)
SPSS中操作
  • 分析 --> 描述统计 --> 探索 -->图
    在这里插入图片描述
  • 原假设: 随机变量是服从正态分布
  • 备选假设: 不服从

这里的 p 与 0.05 比 较 p与0.05比较 p0.05是:假设置信水平是 95 % 95\% 95%,所以显著性水平是 1 − 0.95 = 0.05 1-0.95 = 0.05 10.95=0.05

  • p < 显 著 性 水 平 p<显著性水平 p< ⇔ \Leftrightarrow P 值 < 显 著 性 水 平 P值<显著性水平 P<, 则拒绝原假设 在这里插入图片描述
  • 红线所勾画的显著性代表了我们的 P 值 P值 P
3. Q-Q图来检测正态分布

在这里插入图片描述

qqplot(x)
  • x为要检查分布的一个向量
    在这里插入图片描述

若数据不满住正态分布

  • 不可以使用皮尔逊相关系数
  • 但可以使用斯皮尔曼相关系数

参考资料:数学建模清风视频

;