Bootstrap

马尔可夫性的统计检验(马氏性检验)

可参考:
基于马尔科夫链的产品评估预测
马尔可夫预测法认为,只要当事物的现在状态为已知时,人们就可以预测其未来的状态,而不需要知道事物的过去状态,即马尔可夫链具有无后效性特征,这也被后人称为马尔可夫性。这一特性避开了其他预测方法在搜集历史资料时所遇到的一系列难题,使得它无论是理论上还是应用上都占有很重要的地位。
因此,检验随机过程是否具有马尔可夫性是应用马尔可夫概型分析的必要前提。

第一步、建立转移概率矩阵

准确计算整个目标系统的转移概率矩阵是马尔可夫链预测方法最经常用到也是比较基础的内容。 一般是经常会使用统计估算法,将其方法总结如下:
假设我们所关注的序列片段存在状态的个数为m个,即状态空间I={1,2,……,m} ,将(fiji,j∈I看作为转移频数生成的概率矩阵。第i行,第j列元素在这个转移频数矩阵的值fij除以全部元素和得到的值定义为“概率概率”,用字母pij,i,j∈I来表示,即有
在这里插入图片描述
由状态 i 经一步转到状态 j 的频率也可以用此公式来表示。因为稳定性好是频率的一个特点,所以如果 m 很大的时候,我们可以把频率等价地看成是概率,因而可以用它来估算转移概率 。实际写法上为了方便转移频率用符号 pij 来表示 ,并称之为“转移概率”,一步转移概率也相应地表示为
在这里插入图片描述

第二步、对离散序列进行“马氏性”检验

通常情况下选用离散序列的马尔可夫链来对变量具有随机性的序列进行“马氏性”检验,检验常用χ2(卡方分布) 统计量。
设研究的序列状态个数为m,用(fiji,j∈I表示转移频数概率矩阵,把(fiji,j∈I的 各个列之和去除以(fiji,j∈I的全部元素之和,就会得到“边际概率”,用字母p·j表示 ,其中
在这里插入图片描述
当m很大时χ2(卡方分布) 统计量
在这里插入图片描述
(式子里面的log是因为Inx,在编程中Inx常写为logx)
如果Pij=0,Inx=-∞,所以对此处理是,当Pij=0,fij=0,那么0×∞=0。
它将服从自由度为(m−1)2的χ2(卡方)分布,现在给定显著性水平为α,经查表可得χ2α((m-1)2)的值 。如果χ2>χ2α((m-1)2),则拒绝零假设,可以认为序列具备“马氏性”,反之,则这个序列不能当作马尔可夫链来对待。

卡方分布表

在这里插入图片描述
在这里插入图片描述
χ2分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在χ2分布中得对每个分布编卡方分布临界值表制相应的概率值,这通过χ2分布表中列出不同的自由度来表示,在χ2分布表中还需要如标准正态分布表中给出不同 P 值一样,列出概率值,只不过这里的概率值是χ2值以上χ2分布曲线以下的概率。由于χ2分布概率表中要列出很多χ2分布的概率值,所以χ2分布中所给出的 P 值就不像标准正态分布中那样给出了400个不同的 P 值,而只给出了有代表性的13个值,因此χ2分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了。
查表方法
查χ2分布概率表时,按自由度及相应的概率去找到对应的χ2值。如上图所示的单侧概率χ20.05(7)=14.067的查表方法就是,在第一列找到自由度7这一行,在第一行中找到概率0.05这一列,行列的交叉处即是14.067。
表中所给值直接只能查单侧概率值,可以变化一下来查双侧概率值。例如,要在自由度为7 的卡方分布中,得到双侧概率为0.05所对应的上下端点可以这样来考虑:双侧概率指的是在上端和下端各划出概率相等的一部分,两概率之和为给定的概率值,这里是0.05,因此实际上上端点以上的概率为0.05/2=0.025,用概率0.025查表得上端点的值为16.013,记为χ20.05/2 (7)=16.013。下端点以下的概率也为0.025,因此可以用0.975查得下端点为1.69,记为χ21-0.05/2(7)=1.69。

;