《文献选读与论文写作》课程论文

本文由用户“xiaoxiaoluobo”分享发布 更新时间:2021-07-18 04:27:14 举报文档

以下为《《文献选读与论文写作》课程论文》的无排版文字预览,完整格式请下载

下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。



《文献选读与论文写作》课程论文

论文题目



基于自适应权重的GARCH 模型及应用

GARCH model based on adaptive weight and its application





学 号:

1



学生姓名:

1



***:

1



专 业:

1



班 级:

1



指导老师:

1





2021年 5月 摘 要

本文通过引入一类自适应权重函数,提出了一种新的数据融合方法,来提炼高频数据中的信息,并将所得信息与低频数据结合在一起,构建了一种能充分利用混频交易信息的波动模型:混频GARCH 模型。 针对模型参数估计问题,本文给出了参数的估计方法,分析了估计量的理论性质,得到了相应的中心极限定理并用模拟数据检验了估计量的数据表现。 文中模型有如下优势:首先,与传统融合数据方法依据数据的先后顺序分配权重不同,新权函数的自变量能描述高频交易的特征,这使得基于新权函数的数据融合方法将按照交易特征来分配权重,该分配方式能依据交易特征的变化自动调整不同交易日内权重的分配,从而让每个高频交易所分配的权重与其产生的冲击效果相一致,因此新模型利用高频数据的方式更恰当;其次,新建的模型能利用同一交易过程中多种高频数据,其数据利用程度更加充分。 这些优势使得混频 GARCH 模型具有更好的预测表现,实证结果也证明了这一点。 将多种模型同时用于预测实际数据的波动率,结果表明:混频 GARCH 模型能更加准确又稳健地预测出波动率。 新模型的提出,扩充了利用混频数据分析波动率及其相关问题的方法。

关键词:混频数据;自适应权重;波动率;渐近性质

目 录

一、引言 4

二、模型的构建 5

三、参数估计及其理论分析 6

四、模型的实际应用 9

五、结论 11

参考文献 13

一、引言

波动率在各种金融实践活动中,如风险管理和资产定价,起着重要的作用,一直是金融时间序列分析的主要目标。 传统度量波动率的方法可分为两大类,一类是基于低频数据(日度或月度数据),采用参数模型度量波动率,如 Engle(1982)的 ARCH 模型、Bollerslev(1986)的 GARCH 模型和 Talor(1986)的随机波动模型。 Francq 和 Zakoian(2010)给出了GARCH 族模型较为详细的总结。 另一类是用非参数方法通过分析高频数据的方式来度量波动率。 如 Barndorff 等(2009)的已实现核估计量、Zhang 等(2005)的子抽样估计量以及 Jacod 等(2009)提出的预平均估量。 这两类方法虽然都能较好地描述出波动率的某些特征,但也存在着不足。 其原因是低频参数方法没有充分利用数据信息,忽略了高频数据信息对度量波动率的作用。 Engle 等(2013)研究表明,恰当地整合高频数据信息能有效地提高度量波动率的准确性。 而波动率度量的非参数方法,没有考虑波动率随时间变化的特征,如波动集聚现象。 因此,这两类方法度量波动率的实际效果都不是特别理想。为了能进一步准确地度量和预测出波动率,学者们构建了许多既能描述波动集聚特征,又能充分利用不同频率数据信息的模型。 这些模型可大致分为如下几类。 一类是基于混频抽样技术(MIDAS,Ghysels 等,2004)而构建的波动率模型。 这类模型先利用 MIDAS 方法对历史时期外生低频变量(主要是相关的宏观变量)进行信息压缩,然后依据提炼出的信息和波动率的集聚特征,构建模型来描述波动率。 如 Asgharian 等(2013)提出的 GARCH-MIDAS 模型以及郑某某和尚玉皇(2014)的研究工作。 这类模型主要注重对低频宏观信息的利用,并未考虑高频数据信息的作用。实际高.上频数据中蕴含了实时交易信息,其对波动率的短期预测具有重要价值。 此外,这类模型所采用的 MIDAS 方法中,其权重函数只与数据先后顺序有关,这背后潜在的假定是:随着时间的推移,历史时期的低频变量以相同的方式影响波动率。

二、模型的构建

为了能对混频数据进行分析,Ghysels 等(2004)提出了混频抽样回归模型(MIDAS):



其中, y t 表示低频数据,如某一天的收益率。 z t,j/ m 表示高频数据,如第 t 个交易日内第 j 次交易的收益率。 常数 m 表示一个低频时间间隔内包含的高频数据个数。 MIDAS 方法处理混频问题的基本思想是,先在每一个低频间隔 t 到 t+1 时期内,用加权和的方式将高频数据融合成低频信息量 从而解决数据频率不匹配的问题。 在此基础上,对相同频率的数据信息量和 进行建模分析。 其数据融合中常采用如下形式的权重函数

其中, λ 1 和 λ 2 是未知参数,其大小决定了权重函数的具体表现形式。 其他形式的权重函数可见文献 Ghysels 等(2004)。MIDAS 方法的权重函数具有一些共同的特征。 ①权重函数在低频时间间隔内的具体表现形式由样本数据决定。 因为在应用过程中,决定权重函数形式的参数是利用样本信息估计出来的;②权重函数是以数据的先后顺序(j/ m)为自变量。 一旦参数给定,权重函数在不同低频间隔内的形式完全相同。 这表明,高频数据被赋予的权重完全取决于其在低频间隔内的先后顺序。 换句话说,只要 j 相同,t 到 t+1 时期内的高频数据 z t,j/ m , 其权重与 k 到 k+1 时期内高频数据 z k,j/ m 的权重完全一样。 因此,基于这类权重的 MIDAS 方法或许适合分析各因素产生的长期效果,如郑某某和尚玉皇(2014)的研究工作,但并不适用于提炼日内高频数据中的信息。 其原因是,不同交易日内高频交易往往呈现出不同的特征,那些对未来交易具有更大冲击效果的交易,其在交易日内出现的时刻并不是固定不变的。

无视这种特征,直接使用传统的 MIDAS 方法,依据高频数据的先后顺序而不顾其产生的效果来分配权重,必将导致权重的错配。 文中第五部分的实证结果也证实了这一点。反之,如果能依据高频交易的特征分配权重,使每个高频交易获得的权重与其对未来波动率产生的冲击效果相适应,那么由此构建的数据融合方法所提炼出的高频信息,对波动率的预测具有更大的价值。考虑到高频交易过程的特征及其对未来产生的冲击效果可能反映在某个(些)高频序列中,本文建议采用如下形式的权重函数来融合高频数据:



其中, x t,j/ m 是某种高频数据,如高频收益率、高频交易量等。 实际中,如果有 x t,j/ m 小于零,可对其取绝对值,从而保证权重的非负性。 λ 是待定参数,其大小决定了权函数的大致形态。 当 λ = 0 时,B(j,λ) 为常数,对应的是等权重情形;当 λ < 0 时,较小的 x t,j/ m 将获得较大的权重;当 λ > 0 时,越大的 x t,j/ m 将被分配越大的权重。 在波动率的度量分析中,为了刻画“奇异交易(即, x t,j/ m 较大时对应的交易)”会对未来波动率产生更大的影响,本文将 λ 设定为 λ > 0。 这种情况下,各高频交易所获得的权重之间的差异程度既取决于 λ 的大小又取决于 x t,j/ m 之间差异的大小。 λ 越大, x t,j/ m 之间的差异越显著,各交易的权重之间的差异也就越大,奇异交易对波动率的冲击效果也就越明显。新权重函数具有如下特征:第一,与传统 MIDAS 方法中权重函数类似,该权重函数的大致形态(并不是具体表现形态)由样本数据决定;第二,以高频序列为自变量,只要 x t,j/ m 选取恰当,完全可以使高频交易被分配的权重与其对未来波动率产生的冲击效果相一致;第三,如果 x t,j/ m 是除高频收益率之外的其他高频数据序列,那么用该权重函数来提炼高频交易信息,就能同时利用多种高频数据序列,从而使得数据信息利用得更加充分;第四,如果令 x t,j/ m 为数据发生的时刻,即 x t,j/ m = j/ m, 那么该权重函数就是传统 MIDAS 方法中的权重函数,这表明 MIDAS 方法中的权重函数包含在新提出的权重函数内。

三、参数估计及其理论分析

由于新权重函数是以某种高频数据为自变量,而且其中还带有未知参数,这使得 MIX-GARCH模型具有全新的参数结构,GARCH 模型和 MIDAS 模型中现有的参数估计结果不再适用,需重新研究新模型的参数估计问题。 仿照普通 GARCH 模型的做法,采用拟极大似然函数方法估计模型的参数。 MIX-GARCH 模型的似然函数为:



其中, h t 是模型的条件方差, θ = (ω,α 1 ,…,α p ,β 1 ,…,β q ,λ) 是参数向量, MIX-GARCH 模型的似然函数从形式上看,与普通 GARCH 模型的似然函数完全类似。 而实际情况是,此处 h t 内含有复杂的参数结构,从而导致模型参数估计的理论分析更加困难。为了获得估计量 的大样本性质,需要引入如下条件:①模型的参数满足

这种方法在保持数据产生机制不变的情况下,利用了误差项的独立同分布性质。 通过上述迭代步骤,就能得出协方差阵的估计。 由前面的讨论可知,当 x t,j/ m =j/ m 时传统 MIDAS 方法的权重函数包含在权重函数式(2)中,因此定理 1 和定理 2 及对应的 Bootstrap 方法虽然是针对 MIX-GARCH模型建立的,但也同样适用于 TMIX-GARCH 模型。 后续实际数据的分析中,本文将这些结论直接用于 TMIX-GARCH 模型中,得到相应的估计结果。



上述表格给出了不同交易天数 n 下,模型参数的估计结果。 其中,BIAS 代表估计量的偏差,SE是用 Bootstrap 方法求出的参数估计量的标准误,SD 是估计量的标准离差,CP 表示在 95%置信水 平下的覆盖概率。 第一行代表模型参数的真实数值,其他每行表示不同指标在各情况下的数值。 从表 1 和表 2 中参数估计的结果可以看出,无论模型的参数和误差项做何种假设,各个参数都能准确地被估计出来。 表 1 中 ω、α、β 和 λ 在 n 的各种不同设定中最大的相对偏差(即最大偏差除以真 实值)分别为:2. 25%、2. 93%、0. 35%和 3. 2%。 表 2 中各参数估计量的最大相对偏差分别为:

4%、1. 8%、1. 22%和 3. 02%。 这表明文中提出的估计方法能准确的估计出未知参数,即使在样 本容量较小的情况下( n = 100),也是如此;各种情况下 SD 和 SE 的数值都比较接近,因此定理 2中渐进协方差的表达式以及估计协方差的 Bootstrap 方法都是正确有效的;CP 的结果显示参数估计理论分析结果是合理的。 将表 1 和表 2 中参数估计结果进行纵向对比可发现,参数估计的偏差 及其标准误(SE)随着样本容量的增加而逐步减少;同时,无论在哪一种设定条件下,权重函数的参 数都能被准确地识别和估计出,且估计值与其真实数值几乎相接近。所有这些结果都表明,文中提出的参数估计方法是准确而有效的。

四、模型的实际应用

为了说明文中的数据融合方法能恰当地提炼出高频数据中的信息,而由此构建的 MIX-GARCH 模型具有更好的预测表现。 本文将标准 GARCH 模型、GARCH-RV 模型、TMIX-GARCH 模型和 MIX-GARCH 模型用于上证综合指数的实际交易数据上,对比分析各模型预测波动率的实际表现。 其中,TMIX-GARCH 模型是基于 MIDAS 方法提炼出的高频数据信息而建立的。 考虑到高频交易的日内动量效应(Gao,2015;Elaut 等,2018),本文将日内交易过程分为两个时间阶段。 交易前一个小时为第一时间段,后三个小时为第二时间段。 在 MIX-GARCH 模型中,本文采用如下方式:

来提炼第 t 个交易日内高频收益率中的信息,其中是式(2)的变形, x t,j/ m 是与高频收益率 y t,j/ m 相对应的高频交易量。 在 TMIX-GARCH 模型中,用

的方式来提炼第 t 个交易日内高频收益率中的信息。实际对比分析中,以上证综合指数 2016 年 7 月 13 日至 2019 年 7 月 12 日,共 731 个交易日每隔 5 分钟的高频交易数据为样本。 对高频数据仿照一般的数据处理方法,以每天的对数收盘价减去前一天的对数收盘价作为日收益率。 在每个交易日内,从 9 点 30 分开始对每隔 5 分钟的交易价格进行对数差分,再按照 Asgharian 等(2013)的做法,将差分结果按照复利的方式进行转换,最后得到实际使用的高频收益率数据。 为了计算波动率的预测结果,对上述四种模型,先用前 631 个交

易日数据估计模型的参数,并据此预测未来 20 个交易日的波动率;然后采用滚动向前的方法,即可得到样本期内最后 100 个交易日的波动率预测结果。 各个模型基于前 631 个交易日数据的参数估计结果为:



上述估计结果中,模型的滞后阶数 p 和 q,是利用参数估计的显著性和似然比统计量确定出来的。 括号内的数值是参数估计量对应的标准误,它是通过文中介绍的 Bootstrap 方法计算得到。 从上述参数的估计结果中可以看出,标准 GARCH 模型和 GARCH-RV 模型的参数估计结果在 0. 05水平下是显著的(常数项除外);TMIX-GARCH 模型的 α 系数和 β 系数也是显著的,但权函数的参数并不显著,其标准误非常大。 这表明 TMIX-GARCH 模型并不能识别出交易日内权重分配的模式,其根本原因是 TMIX-GARCH 模型中存在设定误差。 由于该模型的权重函数被设定为以交易发生的时间为解释变量,这使得模型仅依赖数据的先后顺序分配权重,在不同交易日内权重将按照同一个模式进行分配。

接下来,将四种模型的波动率预测值与真实值进行对比分析,来检验各模型的预测表现。 作为比较标准,本文采用已实现核估计量(RK,Bardnorff 等,2009)作为波动率的真实水平。 在 RK 的估计中,仿照王某某和周勇(2018)提出的方法确定其中的最优窗宽。

其中代表由模型得出的波动率预测结果。 其他的评价指标分别为:

上述 MSE 表示预测误差均方平均值,度量了预测误差的二阶矩;MAE 表示预测绝对误差的均值;MSPE 表示预测相对误差均方平均值;MAPE 表示预测相对误差绝对值的均值;R2LOG 表示对数误差均方平均值。 对比分析上述 5 个指标在四个模型中的数值,可以发现:在预测的准确性方面,MIX-GARCH 模型要显著优于其他三个模型,排在第二位的是 GARCH-RV 模型。 TMIX-GARCH模型虽然包含了高频数据信息,但其预测结果并不比标准 GARCH 模型准确。 具体来说,相比标准GARCH 模型,MIX-GARCH 模型的 MAE 平均降低 13. 5%,GARCH-RV 模型的 MAE 平均降低0. 36%,而 TMIX-GARCH 模型的 MAE 却平均增加了 1. 02%。基于新权重的 MIX-GARCH 模型,凭借其利用高频数据方式所带来的优势,能显著提高预报的准确性。在预测的稳健性方面,综合比较 MSE、MSPE 和 R2LOG 这三个指标可得出,MIX-GARCH 模型最优,GARCH-RV 模型和 TMIX-GARCH 模型大致相当,但都比标准 GARCH 模型要好。 由于数据比较小,四个模型 MSE 之间的差异不是很大;但是在 MSPE 方面,相比标准 GARCH 模型,MIX-GARCH 模型平均降低 36. 4%,GARCH-RV 模型平均降低 16. 13%,TMIX-GARCH 模型平均降低17. 67%;此外,在 R2LOG 方面,MIX-GARCH 模型平均降低 22. 39%,GARCH-RV 模型平均降低8. 04%,TMIX-GARCH 模型平均降低 6. 25%。 所有结果说明,MIX-GARCH 模型的预测结果不仅具有更好的准确性,而且也具有更好的稳健性。 同时,新模型的预测优势表明,在预测波动率时基于新权重函数的数据融合方式,能更恰当地提炼出高频数据的信息。

五、结论

本文在综合分析混频抽样技术和波动模型基础上,通过引入一类自适应权重函数,提出了一种新的数据融合方法,并借此构建了一种新的波动模型:MIX-GARCH 模型。 该模型凭借其利用高频数据方式带来的优势,能更加准确又稳健地预测出波动率。 从全文的论述中可以得出:第一,恰当利用高频数据和低频数据等混频信息,比只利用同频率数据信息,能更加准确地预测出波动率,因此在研究与此相关的其他问题时,如风险管理和资产定价等,也应注重对混频数据的利用;第二,在度量和预测波动率时,传统 MIDAS 方法不能有效地提炼出高频数据的信息,而依据交易特征(即高频交易量)分配权重的数据融合方法比等权重的方法更能有效地提炼出高频数据信息,在此基础上构建的 MIX-GARCH 模型能更加准确地预测出波动率;第三,虽然新权重函数使得文中构建的模型具有新的参数结构,但拟极大似然方法仍然能够准确地估计出模型的参数,包括权重函数的参数,其参数估计量也具有相应的中心极限定理,也可以采用对应的 Bootstrap 方法来计算参数估计量的标准误。文中提出的新数据融合方法,扩充了分析混频数据的手段,而由此构建的 MIX-GARCH 模型也丰富了研究波动率的方法。 仿照文中的做法,在相关问题的分析中,如果同时拥有低频和高频数据,可以先利用新提出的方法来融合高频数据信息,借此解决数据频率不匹配的问题,再在此基础上构建相应的模型,以期能得到更加准确的分析结果。 此外,MIX-GARCH 模型及其扩展形式还可用于指导相关实际金融活动,如风险管理和资产定价等。 这些都是笔者后续研究的方向。

参 考 文 献

[1]王某某,周勇.高频数据波动率非参数估计及窗宽选择[J].系统工程理论与实践,2018(10):2491-2500.

[2]于某某,王某某.基于混频已实现 GARCH 模型的波动预测与 VaR 度量[J].统计研究,2018,35(1):104-116.

[3]郑某某,尚玉皇.基于宏观基本面的股市波动度量与预测[J].世界经济,2014(12):118-139.

[4]AsgharianH,HouAJ,JavedF.The Importance of the Macroeconomic

Variables in Forecasting Stock Return Variance: A GARCH- MIDAS Approach [J].Journal of Forecasting,2013(32):600-612.

Barndorff-NielsenOE,HnsenPR,LundeA.Realized Kernels in Practice

:Trades and Quotes[J]. Econometrics Journal,2009(12):C1-C32.

BerkesI,Horvath L,Kokoszka P.GARCH Processes:Structure a 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 state Tax〔R〕Joint Economic Committee Study,December1998. [10]Galio.M.A&Sveeii.J.Internationalizing the family

Business :facilitating and restraining factorsCJlFamily Business Review,1991,4(2):181-190. [11]James.B.Davies. The Relative Importance of Inheritance and Other Factors on EconomicInequality〔J〕. Quarterly Journal of Economics31982,Vol.97,No.3:495. [12]Lansberg.I.S.Managing human resources in family finns:the problem of institutional overlap〔J〕.Organizational Dynamics,1983,summer:39-46.

[文章尾部最后500字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。

  1. 数据科学与大数据技术培养方案
  2. 关于卡佐设备掉线原因分析
  3. 大数据对传统小数据的拓展及其区别与联系
  4. 20-21-1《数据库原理》实验报告及要求()
  5. 数据分析基本流程
  6. 火车采集器说明文档
  7. java学习
  8. 后疫情时代的经济学分析 ——中文
  9. 数据库复习知识点(1)
  10. 3.1数据编码第2课时-【新教材】教科版()高中信息技术必修一教案
  11. 一种基于数据分析的异常用电稽查方法设计开题报告
  12. 裴庄产线自动化数据断网应急处置办法
  13. python笔记
  14. (图)在数据分析过程中渗透计算思维的培养_221
  15. 大数据立法建议
  16. 条形统计图教学设计
  17. 中国沿海某区域水下地形演变趋势

以上为《《文献选读与论文写作》课程论文》的无排版文字预览,完整格式请下载

下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

图片预览