憔悴到了转述中文综述的时候了........
在统计学角度来看,时间序列分析是统计学中的一个重要分支, 是基于随机过程理论和数理统计学的一种重要方法和应用研究领域. 时间序列按其统计特性可分为平稳性序列和非平稳性序列. 目前应用最多的是Box一JenkinS 模型建模法, 它是由G.E.P.Box和英国统计学家G.M.JenkinS于1970年首次系统提出的.Box一JenkinS方法是一种较为完善的统计预测方法 , 他们的作用是为实际工作者提供了对时间序列进行分析、预测 , 以用对ARMA模型识别、估计和诊断的系统方法. 优点在于如果建立精确的模型后,并确定模型的系数之后,就可以根据有限的数据集对其发展进行预测 , 其中对于平稳性时间序列多采用ARMA模型 , 对于非平稳性时间序列模型常通过适当地变换 (如差分、取对数) 将它变为ARMA模型后再进行建模,这类模型Box一JenkinS称为ARI琳(求和自回归滑动平均模型) 。
参考链接:时序分析基础
一. 平稳时间序列模型
数据的预处理:
数据的预处理包括缺失值的补充、数据的平稳化及单位根检验.
平稳性
平稳性是时间序列分析中很重要的一个概念。一般的,我们认为一个时间序列是平稳的,如果它同时满足一下两个条件:
1)均值函数是一个常数函数。
2)自协方差函数只与时滞有关,与时间点无关。
以上面两个时间序列为例。两个序列均满足条件1),因为标准正态分布白噪声和其形成的随机游走的均值函数都是值恒为0的常数函数。再来看条件2)。白噪声的自协方差函数可以表述为:
可以看到只有在时滞为0时值为1,其它均为0,所以白噪声是一个平稳序列。
而随机游走我们上面分析过,其自协方差为:
很明显其自协方差依赖于时间点,所以是一个非平稳序列。
后面可以看到,一般的时间序列分析往往针对平稳序列,对于非平稳序列会通过某些变换将其变为平稳的,例如,对于随机游走来说,其一阶差分序列是平稳的(显然其一阶差分是白噪声)。
时序分析主要统计量
注意时间序列中的每一个元素都是一个普通的随机变量,如果忽略序列的时间性,那么我们面对的实际上是一个随机变量集合,所以从这个角度来说时间序列的统计分析与普通统计分析没有太大不同,相关的理论也是通用的。
对于随机变量集合来说,要完整描述其统计特性需要处理其多元联合分布,这是非常复杂的。所以实际我们往往做一些必要的简化假设,避免处理复杂的多元联合分布。
现假设我们有随机时间序列
下面先给出一些常用的统计量。后面会接着通过一些常见序列来举例说明各统计量如何计算。
均值
均值函数被定义为关于自变量t的函数:
t的均值函数值表示在t时刻随机变量Yt的期望。
方差
与均值类似,方差是t时刻序列元素的方差:
自协方差
自协方差是一个二元函数,其自变量为两个时间点,值是两个时间点上序列值的协方差: