- 选题背景和意义:
时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列,而时间序列分析是专门为了解决时间序列以及衍生问题而诞生的统计学分支,时间序列分析的主要目的是根据已有的历史数据对未来进行预测。近些年来,随着时间序列分析的理论与应用这两方面的深入研究,时序分析应用的范围日益扩大。作为一种定量预测方法,时间序列分析在国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测、气象预报、水文预报、地震前兆预报、农作物病虫灾害预报、环境污染控制、生态平衡、天文学和海洋学等领域有着广泛且成熟的应用。
从历史的角度来看,现代时间序列分析起源于英国统计学家Yule在1927年提出的AR(Auto Regressive)自回归模型,该模型与英国统计学家 G.T.Walker 在 1931 年提出了 MA(Moving Average)移动平均模型和 ARMA 模型,构成了时间序列分析的基础,至今仍被大量应用。这三个模型主要应用于单变量、同方差场合的平稳序列。在我们的统计参考书和统计软件里,ARMA模型的残差项是独立同分布的正态随机变量,不仅如此,绝大多数平稳时间序列模型的残差项也常选择服从正态分布的白噪声作为随机项,而用这种残差项建立的经典时间序列模型存在着一个问题,即模型的稳健性不足且易受到异常点的影响。目前,模型的稳健性问题已经变成了统计软件需要解决的主要问题(对于回归分析、谱系分析等同样适用)。对于数据分析师们来说,整个排查异常值的过程存在着许多不确定性,这将导致删掉异常点之后得出的结论有失偏颇。除此之外,对模型作稳健估计往往很费时间,其原因如下:
- 稳健性估计法不止一种,要确定哪种方法好会很繁琐;
- 当实际数据很复杂时,能使用的方法很少。
这一系列现象表明,残差项的正态假设并非适用一切情况,而且正态分布的性质也表明,正态假设只适合于薄尾分布的情形。因此,无论是从理论发展的需要,还是从实际应用的效果来看,我们都需要去寻找新的假设。而在Kenneth,Roderick和Jeremy于1989年发布的《使用t分布进行稳健建模》中,已经指出了在非线性回归、不平衡重复测量数据和谱系分析中,使用服从t分布的残差项建立的模型具有更好的稳健性。这暗示着我们对时间序列模型残差项的分布假设可以从t分布噪声的角度进行改进。
本次选题旨在通过对当前已有的时间序列模型知识的学习,了解白噪声时间序列的概念和t-分布的概念,熟练掌握时间序列的性质,通晓时间序列模型的性质,在领会带正态残差项的时间序列模型的基础上能够对数据拟合出带t噪声的时间序列模型。同时希望可以通过对统计软件的学习等,来实现简单的算法模型,拟合一些实际问题。
- 文献综述(或调研报告):
- 起源与发展
最早的时间序列分析可以追溯到 7000 年前的古埃及。古埃及人把尼罗河涨落的情况逐天记录下来,从而构成一个时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律,由于掌握了涨落的规律,古埃及的农业迅速发展。这种从观测序列得到直观规律的方法即为描述性分析方法。在时间序列分析方法的发展历程中,经济、金融、工程等领域的应用始终起着重要的推动作用,时间序列分析的每一步发展都与应用密不可分。
一般地,人们认为现代时间序列分析起源于英国统计学家 G.u.Yule 在 1927 年提出的 AR(Auto Regressive,自回归)模型。该模型与英国统计学家 G.T.Walker 在 1931 年提出了 MA(Moving Average,移动平均)模型和 ARMA 模型,构成了时间序列分析的基础,至今仍被大量应用。这三个模型主要应用于单变量、同方差场合的平稳序列。其后,Box 和 Jenkins 在 1927 年出版的 Time Series Analysis: Forecasting and Control 被认为是时间序列分析发展的里程碑。该书为实际工作者提供了对时间序列进行分析、预测以及对 ARIMA 模型识别、估计和诊断的系统方法。ARIMA 模型也被称为 Box-Jenkins 模型,主要应用于单变量、同方差场合的线性模型。该模型可以处理非平稳序列,主要思想是先对非平稳序列进行差分,使之变为平稳序列,然后再用 ARMA 模型来拟合差分后的序列。
- 拓展与延伸
随着时间序列分析理论的发展,人们发现这些假设在一些情形下并不成立,例如 Moran(1953)对加拿大山猫数据的建模过程中发现数据中的怪异特征,即大于均值的样本点的残差显著地小于那些小于均值的样本点的残差。因此,人们越来越关系异方差、多变量、非线性的时间序列。
对于异方差情形,Engle(1982)首先提出 ARCH(Auto-regressive conditional heteroskedasticity,自回归条件异方差)模型。ARCH 模型的基本思想是假设同一时刻噪声服从均值为零,方差是一个随时间变化的量(即为条件异方差)的正态分析,且这个随时间变化的方差是过去有限项序列值平方的线性组合(即为自回归)。作为一种全新的理论,ARCH 模型在近几十年里得到了极大的发展,已被广泛地用于验证金融理论中的规律性描述以及金融市场的预测和决策。该模型也也被认为是近来金融计量学发展中最重大的创新。然而,ARCH 模型只适用于异方差函数短期自相关过程,为此 Bollerslev(1986)对 ARCH 推广至广义自回归条件异方差(GARCH)模型,GARCH 模型更能反映实际数据中的长期记忆性质。ARCH 的另外几种推广形式有 Engle 等人(1987)提出的 ARCH-M 模型和 Nelson(1991)提出的指数广义自回归田间异方差(EGARCH)模型,等等。
对于多变量的情形,自然的想法是吧一维时间序列的分析方法推广至多维。因此,早期对于多维时间序列的分析方法中往往要求每个序列都是平稳的。常见的模型有向量 ARMA 模型、向量自回归模型(VAR)等。由于从一元自回归滑动平均模型到多元的情形不能直接推广,其间存在很多问题和需要克服的困难,包括模型的识别、估计和解释等,因此这方面的发展相对较慢。直到 Engle 和 Granger(1987)提出了协整(co-integration)理论及其方法,为多维非平稳序列的建模提供了一种途径。协整理论中各序列可以都是不平稳的,它们的线性组合却是平稳序列,该理论可以解释变量之间的长期稳定的均衡关系。协整方法已成为了分析非线性平稳序列之间数量关系的最重要工具之一。对于序列之间存在非线性的调整机制的情形,Balke 和 Fomby(1997)提出了阈值协整(Threshold Cointegration)方法。例如,在股票交易过程中,由于交易费用、交易政策等因素会导致股价的非对称调整;国家的货币政策由于制度方面的原因也会对通货膨胀率产生非对称调整行为。
对于非线性情形,Tong 和 Lim(1980)提出了 TAR(Threshold Autoregressive,门限自回归)模型。TAR 模型假定在状态空间的不同区域,模型有不同的线性形式,状态空间的划分通常由一个门限变量来确定,该模型属于参数模型。近二十年来,人们更多的关注时间序列的非参数模型,如非参数自回归(NAR)模型、非参数自回归异方差(NARCH)模型等。
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。