Bootstrap

R语言:无法精确计算带连结的p值

当你在使用cor.test,wilcoxon.test等这些函数时,不知道有没发现一个exact参数,以及是否遇到过无法精确计算带连结的p值这个warning。如果有,请往下看。

这个问题应该是很常见的,《非参统计》书里写道:
数据中有相同的数字,成为结(tie),结中的秩为按照升幂排列后位置的平均值,如果结多了,零分布的大样本公式就不准了,因此要做修正。”

对于wilcox.test,是基于样本来自连续对称分布的总体,所以本不应该有相同的值,但是由于四舍五入,连续变量观测到的值都是离散的,因此会产生打结。所以需要修正,或者加exact=FALSE,也不会有warning了。

对于cor.test,同上。

注意:exact参数不能随便设置,不能偷懒而一直设置exact=FALSE,不然会出现计算的p-value不准确的结果。比如:会出现非对称的火山图。
具体的修正公式,参考书籍:
在这里插入图片描述

;