Bootstrap

AI顾投高级策略之五:克莱夫.格兰杰因果分析预测法(建议收藏)

作者:老余捞鱼

原创不易,转载请标明出处及原作者。

写在前面的话:
诺贝尔经济学奖得主克莱夫·格兰杰(Clive Granger)在 1969 年率先提出了一种用于假设检验的统计方式,其旨在明确一个时间序列能否对另一个时间序列进行预测。他主张,在经济学里因果关系能够借助使用一个时间序列的先验值对于相对滞后的另一个时间序列的预测能力加以检验。经过在其基础上的不断完善,50余年后,该方法在 AI 顾投策略当中得到了运用。

        在诸多有关回归分析的介绍中,均着重强调,经分析得出的两者(或数者)仅仅存在相关性,并非因果关系。例如通过回归分析,剖析出折扣与销售量变化的关系,这仅表明二者具有相关作用,而不能就此认定折扣为因,从而致使销量增加等情况。

        在回归分析里,通常仅能够表明不同变量之间的同期相关性,而自回归模型仅能得出同一变量前后期的相关性,然而格兰杰通过论证以及一系列检验揭示出不同变量之间存在时间落差的相关性是行得通的。这是因为我们坚信,过去的事件有可能会引发现在或者未来的事件。

        格兰杰因果关系分析依据两点原则,其一为因果在时间上的先后次序,即因通常先于果出现;其二是因当中包含影响未来的信息,也就是因能够致使果的产生。

        下面是格兰杰因果关系分析法在实际经济领域的一些分析输出。
(a) 1860 年至 2011 年英国年度工资和价格的对数;
(b) 1860 年至 2011 年英国年度生产力和资本存量的对数;
(c) 1955 年至 2004 年英国季度实际消费者支出和可支配收入的对数;
(d) 莫纳罗亚火山的二氧化碳浓度。

       格兰杰因果关系分析所测试的并非 X 是否致使 Y ,而是测试 X 是否能够预测 Y 。当对变量 X 是否对变量 Y 存在因果影响进行分析时,只需估量 X 的过去值是否对 Y 的现状值产生影响即可。

       以下图为例,当时间序列 X 模式在时间上滞后于 X 的时间序列 Y 模式且在其中大致重复,那么便可以认为 X 的过去值能够用于预测 Y 的未来值。

       由此可见,格兰杰因果关系检验虽说揭示了彼此存在因果影响,然而这种因果并非真正意义上的因果,仅仅是统计学层面的一种估量。当自变量 X 作为因产生变化时,因变量 Y 作为果也会随之改变。

       例如,吃未彻底煮熟的海鲜会致使拉肚子,而止泻药能够帮助止住拉肚子,那么在购买止泻药之前吃海鲜,并不能断言由于海鲜消费的增多导致了止泻药销量的增加,不过海鲜消费有利于精确预测止泻药的情况。这便是无法得出因果关系的格兰杰因果关系分析。

      数学公式的表达如下:

       Y 和 X 均为平稳的时间序列,为了检验 X 不导致 Y 的原假设,引入 Y 的过去期数值,并构建 Y 的自回归模型。

        然后引入X过去期的值来增强自回归:

       格兰杰因果关系检验假设 x 和 y 时间序列都是平稳的。如果不是这种情况,那么在使用格兰杰因果关系检验之前,必须首先采用差异、去趋势或其他技术。

        以下数据是1931年到1970年的鸡群和产蛋量数据,自古以来的问题:是先有鸡才有蛋,还是先有蛋才有鸡,可以通过格兰杰因果分析进行研究一下。

       但是这两组数据并非平稳的时间序列数据,如下图所示。

        为此,将对时间序列差分,得出如下平稳的数据和图示。

         然后将相关平稳的时间序列数据放入SPSSAU进行格兰杰因果分析,得到结果如下:

       格兰杰因果关系分析,对这组数据得出结果,说明了先有蛋而有鸡,因为在原假设产蛋量不是鸡群的原因中,P值为0.013,小于0.05,因此拒绝原假设,所以选择了备选假设即产蛋量是鸡群的原因。  

       另一个假设,鸡群不是产蛋量,由于P值0.268大于0.05,因此接受原假设即鸡群不是产蛋量的原因。   

       虽然这种格兰杰因果关系分析方法是流行常用的方法,不过它也有时候不能真正地发现因果关系,并且还有它的局限性,因为理论上还存在其他可能的干扰因素,但这种分析并没有纳入这种干扰因素。980年代由其他的计量经济学家对这种分析加以修改、扩充,将可能的第三(以上)变量纳入测试,成为使用面板资料的向量自回归模型(英语:panel data VAR model)。相较于最初版的格兰杰因果分析分析,扩充版可以产生更有效的估计结果。


本文内容仅仅是技术探讨和学习,并不构成任何投资建议。

原创不易,转载请标明出处及原作者。

;