皮尔逊相关系数假设检验条件
皮尔逊相关系数假设检验条件
如果数据不为正态分布,则不可以使用皮尔逊相关系数
如何检验数据是正态分布?
检验数据是正态分布
1. 正态分布JB检验(大样本 n>30)
- 原假设: 随机变量是服从正态分布
- 备选假设: 不服从
这里的 p 与 0.05 比 较 p与0.05比较 p与0.05比较是:假设置信水平是 95 % 95\% 95%,所以显著性水平是 1 − 0.95 = 0.05 1-0.95 = 0.05 1−0.95=0.05
- 当 p < 显 著 性 水 平 p<显著性水平 p<显著性水平 ⇔ \Leftrightarrow ⇔ P 值 < 显 著 性 水 平 P值<显著性水平 P值<显著性水平, 则拒绝原假设
S = skewness(x) % 偏度
K = kurtosis(x) % 峰度
- 此处的x必须为一个向量
JB检验的代码
要求样本量大于30
[h,p] = jbtext(x,alpha)
- h = 1 h = 1 h=1 : 拒绝原假设; h = 0 h = 0 h=0:不能拒绝原假设
- x:检验的随机变量 — 必须为向量
- alpha: 代表显著性水平
- p:代表概率论与数理统计中的P值
2. Shapiro-wilk夏皮洛-威尔克检验(小样本3<=n<=50)
SPSS中操作
- 分析 --> 描述统计 --> 探索 -->图
- 原假设: 随机变量是服从正态分布
- 备选假设: 不服从
这里的 p 与 0.05 比 较 p与0.05比较 p与0.05比较是:假设置信水平是 95 % 95\% 95%,所以显著性水平是 1 − 0.95 = 0.05 1-0.95 = 0.05 1−0.95=0.05
- 当 p < 显 著 性 水 平 p<显著性水平 p<显著性水平 ⇔ \Leftrightarrow ⇔ P 值 < 显 著 性 水 平 P值<显著性水平 P值<显著性水平, 则拒绝原假设
- 红线所勾画的显著性代表了我们的 P 值 P值 P值
3. Q-Q图来检测正态分布
qqplot(x)
- x为要检查分布的一个向量
若数据不满住正态分布
- 不可以使用皮尔逊相关系数
- 但可以使用斯皮尔曼相关系数