基于三阶段门限自回归模型的我国豆粕期货市场跨期套利量化投资分析
作者: 陈新华
摘 要:基于期货市场同一品种不同交割月份合约间价差的非线性特征及均值回复机制,利用存货理论、无套利定价理论和三阶段门限自回归模型研究了一种期货市场跨期套利量化交易策略,并利用大连商品交易所2017—2021年豆粕期货合约的日度价格数据对该策略进行了回测分析。研究发现:第一,从长期来看,豆粕期货合约近月份和远月份相差四个月的跨期套利组合价差自回归波动的上、下门限值并不显著,利用其作为判断无套利区间范围而进行跨期套利交易回测的盈利情况也并不稳定;第二,不同时间长度跨期套利组合价差序列门限的数值和显著性都存在较大差异,利用400天期价差序列门限值进行的动态量化投资回测效果要好于长期和短期价差序列;第三,整体来看,跨期套利的风险控制效果要优于投机交易,但是无套利区间不同的选取方式会使得量化投资策略的回测风险存在较大差异。
关键词:跨期套利;量化投资;存货理论;无套利定价理论
中图分类号:F323.7
文献标识码:A
文章编号:1008-2697(2024)05-0017-08
一、引言
期货市场是我国市场经济体系的重要组成部分。根据中期协数据,2022年我国商品期货与期权品种成交量已经占全球总量的72.3%。特殊的保证金交易制度所产生的杠杆效应使得期货市场相较于传统的股票市场而言,风险和收益都被放大了数倍甚至数十倍,因此也吸引了众多风险偏好型投资者的参与。由于我国期货市场发展历史较短、市场成熟度相对于西方发达国家有所欠缺,再加上期货投资咨询业务发展的相对滞后以及套利交易相关知识还未完全普及等原因,使得我国期货市场大部分自然人投资者仍然以投机交易为主。套利交易的操作方式虽然相对于投机交易更为复杂,但却有着众多的优点,主要表现在以下三个方面:首先,从投资者角度来看,相对于通过预测价格波动方向的投机交易而言,套利交易着重分析价差变化趋势,能够有效降低投资风险;其次,套利交易能促进期货合约的正确定价。当市场出现严重价格偏离时,套利者的交易行为有利于期货价格回归到合理区间,从而进一步增强期货市场的定价能力;第三,套利交易可以有效降低投资者的非理性行为,减少非正常的市场波动,稳定期货市场价格风险的转移功能[1-4]。
经过多年的积累,我国期货市场多个期货品种不同交割月份合约的流动性都在不断提高,同一品种不同月份合约间的价格关系也不断趋于合理,为投资者进行跨期套利交易打下了良好基础。基于此,本文试图利用存货理论、无套利定价理论及三阶段门限自回归模型,探索一种有效的期货市场跨期套利的交易方法。以期望通过对我国期货市场套利交易的研究,有效减少投资者的非理性投机行为,提高市场的有效性,促进我国期货市场的良性发展,从而提升其服务国民经济的能力。本文结构安排如下,第一章是引言;第二章为文献综述;第三章是研究设计,包括理论分析、研究假设、检验与评估方法;第四章是实证分析;第五章为本文的结论。
二、文献综述
目前,国内外关于期货市场跨期套利交易的相关研究已经十分丰富,总体而言可以分为以下两个大类:第一,基于协整统计的套利研究。因为期货合约价格往往会呈现出不平稳的状态,因此协整方法经常被用来确定不同合约间的价格关系,然后根据这种相对稳定的价差关系选择与之对应的无风险套利上下区间,如有学者利用该方法对众多农产品和工业品期货合约的跨期套利交易策略进行了研究[5-7]。在此基础上,Simon[8]、Haigh & Holt[9]、周亮[10]等关注到了期货合约价格常常会呈现波动集聚的特性,尝试将GARCH类模型引入到期货市场的跨期套利分析过程中。此外,一些学者也引入了市场信息冲击、流动性冲击和投资者情绪波动等外部因素分析了跨期套利的风险与收益,并检验了其在高频数据中的应用[11]。第二,机器人学习方法。随着对于跨期套利交易研究的深入,越来越多的学者关注到两个月份合约之间的价差序列所呈现出来的非线性特征,并利用机器学习在处理非线性数据时具有的优势来分析其构造套利策略逻辑上的可行性。学者们将BP神经网络、Elman神经网络、递归神经网络(RNN)、RBF神经网络等多种网络结构方法应用到期货市场价差序列的波动预测的研究中,并根据研究结果来选取套利交易的策略[12-18]。在这些研究成果的基础上,邓亚东、王波[19]、Moritz & Zimmermann[20]则开始关注支持向量机和随机森林等机器人深度学习的方法在套利交易中的运用。
相对于已有的研究,本文的边际贡献在于:第一,尝试用金融学和统计学相关理论去分析无风险套利区间出现的原因并计算其数值;第二,相对于大多数研究选取一个固定门限值的方法,本文根据存货理论提出了一个动态无风险套利区间识别的交易策略,并对其进行了回测与对比。
①在定价的过程中假设满足无违约风险、资金借贷利率相同及没有交易成本等条件。
三、研究设计
(一)理论基础与研究假设
由于期货市场特殊的交割制度、不同标的资产持仓及套利成本的差异,同一期货交易所的同一期货品种不同交割月份合约间的价差存在一个合理的区间。假设在一个完美的市场条件①
在定价的过程中假设满足无违约风险、资金借贷利率相同及没有交易成本等条件。下,不同月份期货合约间合理的价格关系可以表达为式(1):
Ft-FT=Ft[1-e(r+c-y)(T-t)](1)
其中t表示近月份,T为远月份,Ft为某种期货品种近期合约的价格,FT为远期合约的价格,r为期
货合约有效期内的无风险利率。c为以现货价格一定比例表示的仓储成本和保险费用等,y为边际便利收益。
由式(1)发现,在市场供给状况较为平稳的状态下,可以通过无风险利率r和仓储成本c来计算远期合约和近期合约之间的一个合理的价差关系。如果真实的市场情况是远月份合约价格高于近月份合约价格的部分远远的超过了资金占用和储存成本的总和,那么一个比较理性的投资方式是买入近月份合约的同时卖出远月份合约,反之则可以采取一个反向的跨期套利交易策略。因为,当两个合约价差关系回归到合理的区间后,平仓两个合约的收益将大于套利成本,最终会产生一个风险较小的套利收益。由此,投资者可以根据不同合约标的物的资产特性计算跨期套利交易的无风险套利区间。但是,随着经济全球化的发展,一国的某种商品的期货价格不仅取决于国内的供需关系,还会受到国际现货价格和期货价格等众多因素的影响。因此,在期货合约价差关系中起重要作用的便利收益的大小会随着不同标的资产供需状况的结构性周期变化而存在差异。因此,要制定准确的跨期套利策略,应该根据市场状况和投资者的预期变化不断调整无套利区间的范围。基于以上的理论分析提出本文的研究假设:
H:根据套利区间变化的动态跨期套利交易策略能有效降低投资风险。
(二)检验与评估方法
为了对以上假设进行检验,需要对期货合约跨期组合价差序列的无风险套利区间进行准确度量,并对比采用动态调整无套利区间方式下的套利策略与固定套利区间下套利策略投资回报的差异。在整个研究过程中,科学计算期货合约组合价差无套利区间上下限数值是关键所在。虽然不同投资者对于套利成本的预期可能会存在较大差异,但是仍然可以通过识别市场价差序列波动的均值回复机制来捕捉投资者的套利行为,从而找出市场投资者所普遍认可的无风险套利区间的边界。当价差的波动超过
无套利区间上下限时,套利者的介入可能会改变价差序列原本的变化规律从而导致该时间序列产生非线性的状况。因此,如何测量这种非线性的变化特
征和临界点是分析无风险套利区间的核心内容。本研究利用门限自回归模型来分析期货价差时间序列可能存在的非线性波动特征,并参考其自回归门限
值的大小来确定无套利区间的取值。具体而言整个检验步骤如下:
1.数据特征分析
对跨期套利组合的价差时间序列进行平稳性检验,并利用自相关系数、偏自相关系数及AIC准则等方法分析每个序列的相关滞后阶数,以确定门限值计算过程中的滞后阶数的搜索范围。
2.利用门限自回归模型评估无套利区间范围
本文利用Tasy所提出的TAR模型研究金融时间序列非线性特征的主要思想,在每个期货价差时间序列中引入n-1个门限值,这样使得时间轴变成n段[21]。对于时间序列{Xt,t=1,2,…},TAR模型可表示为以下形式:
xt=φj0+φj1xt-1+φj2xt-2+...+φjpxt-p+εjt=
φ(j)0+φ(j)1xt-1+φ(j)2xt-2+…+φ(j)pxt-p+ε(j)t
当rj-1<xt-e<rj (j=1,2,…,n)
其中:-∞<r1<…<rj<rt-1<∞,rj表示门限值,j=1,2,…n-1;
n表示门限区间的个数,n-1表示门限值的个数;
e表示延迟步数,xt-e表示门限变量;
{εjt}或{εt(j)}是均值为0方差为σ2j的白噪声序列;
φjp或φp(j)是自回归系数,属于排序为j的模型;以上模型简称:TAR(e,n,p1,p2,p3),pj指在第j个阶段,其中的AR模型阶数[22]。
利用AIC准则对每个区间进行逐步建模,以确定门限区间的个数n、门限值γ以及延迟步数d。单个模型AIC值和整体AIC值的表达式如式(2)和(3)所示:
AIC(pj)=min{Njlnσ2j+2(pj+1)}…j=1,2,…,n(2)
AIC(n;d;r1,r2…rt-1)=∑lj=1AIC(pj)(3)
对比选取AIC值最小的模型,即可计算出每个期货套利组合价差时间序列的门限值情况,进而测算出其无套利区间的范围。