现实与理想
诸多市场异象的发现使人们对有效市场假说的质疑愈发深重,这些异象主要集中在:收益分布正态性、波动率与时间长度幂率关系、市场记忆性等方面。而分形市场理论则与之不同,它具备两个明显特征:长记忆性(长程相关性)和标度不变性。
分数布朗运动
Peters在系统性提出分形市场理论的同时,还用分数布朗运动来描述金融市场的运行。所谓分数布朗运动实际是由标准布朗运动扩展而来,具有自相似性,其序贯极差亦服从TH定律。同时,由分数布朗运动性质,不难发现使用Hurst模型的理论基础。
Hurst模型的打开方式
金融市场中大多数时间序列的波动往往表现为非周期性循环,重标极差分析法从标度不变性角度出发,不仅能有效计算非周期性循环的平均循环长度(避免传统谱分析弊端),而且还能分析周期性循环的固定周期。
在重标极差法下计算Hurst指数,为保证结果稳定性与准确性,将子区间长度N的上限确定为非周期性循环的平均循环长度极有必要,而平均循环长度的计算有赖于重标极差分析。
此外,由于分形市场理论并不以正态分布为前提,因此,传统的算术平均和标准差形式并不适用于Hurst指数的期望和标准差的计算公式
。
Hurst模型在指数择时上的应用
利用时变Hurst指数制作多空择时策略,对于上证综指,在10年半的时间内,Hurst模型共发出20次信号(反转信号共7次),共获得累计33.72倍的收益,年化收益39.80%,最大回撤-18.54%。而对于上证50,在过去4年半的时间内,Hurst模型共发出13次信号(其中反转信号共3次),累计收益达78.37%,年化收益13.72%,最大回撤-16.19%。对于沪深300指数,在过去3年半的时间内,Hurst模型共发出10次信号(其中反转信号共4次),累计收益191.15%,年化收益35.71%,最大回撤为-18.06%
。
今年以来,基于周频数据的上证综指Hurst指数已先后两次进入反转区域(2017.3.17~2017.5.5、2017.6.16至今),并分别于2017.4.7、2017.7.21发出由涨转跌的反转信号。
理想与现实
1.1、市场异象
有效市场假说是金融市场研究的一个重要概念,其核心思想是,任何时刻证券的价格都完全并正确反映了所有可获取的信息,它对应于一种理想的市场结构,即:收益率序列具有独立(或短期记忆性)、线性、有限方差等特征,并服从正态分布。然而,近年来,诸多市场异象的发现使得人们对有效市场理论的质疑声愈发深重。
1)老调重弹的尖峰厚尾
考察过去十年来股票市场的统计特性,无论从日收益还是从周收益的角度看,其偏度和峰度两个统计量均显著异于正态情况下的值(正态分布下的偏度和峰度值分别为0和3),且J-B统计量均大于5%临界值,说明其具有显著的尖峰厚尾特征。
同时,尖峰厚尾现象在相关指数收益分布图上亦得到明显的印证:
究其原因,在于投资者不仅根据自身对股票价格和价值的判断来进行投资决策,同时,其决策也往往受股价波动趋势的影响:在一个连续的上涨(或下跌)趋势得到确认后,投资者会相信新一轮上涨(或下跌)行情的到来;因此,在市场的一轮上涨(或下跌)趋势得到确认后,往往紧跟着连续的上涨(或下跌),这便会导致收益分布在两个尾部要比正态分布“厚”。同时,由于投资者对于趋势的确定存在一个阈值效应(只有波动超过一定阈值,投资者才会作出相应反应),因此,在收益分布中,峰部和尾部占优更大的比重。
2)神奇的1/2法则?致命的1/2法则?
在股市收益满足随机运动和正态分布的假设前提下,股市收益率序列的标准差是有限的,因此可用于测度股市收益的不确定性,且标准差具有如下标度关系:
这就是著名的1/2法则,意味着标准差依时间的平方根而呈现规模变化,同时,这也指出了计算波动率的另一种方式,即:以日波动率乘以时间长度的平方根来计算一段时间内的累计波动率。如果对以上等式两边取对数,不难发现,在双对数图上,(log(σ(Tτ) ),log(T))是以斜率为1/2的直线。
但事实是否果真如此?我们对国内股票市场(上证综指)进行测试,不难发现,短期内,上证综指实际波动率值与理论波动率值(即:通过1/2法则计算得到的波动率)较为接近(通常实际波动率值略高),但存在一个转折点N,当时间长度大于N后,实际波动率与理论波动率间将开始出现较大偏差(实际波动率远低于理论波动率)。
以图3为例,我们测试了截至2008-1-23不同时间长度的波动率。从波动率-时间的双对数图(Lnσ–Ln T图)上不难发现,当时间长度大于61天后,理论波动率与时间波动率间出现较大偏差,而当时间长度小于61天时,实际波动率和理论波动率间值亦非严格相等(大多数情况下,波动率是以比时间的平方根略高的速率在增加)。而若我们使用相同的市场参数重新进行随机模拟,则不难发现,在平均的意义下,波动率和时间长度间能够较好地遵循1/2法则,即:1/2法则能够很好地适用于随机运动,但却不适合股市。
3)自相关性
随机游走和有效市场假说假设证券收益的时间序列中不存在相关性,市场对过去是无记忆的。但越来越多的研究表明,金融市场收益序列的相关性始终存在,除了早已为人所熟知的马氏短记忆效应外,市场往往具有长程相关性(当我们将时间滞后期拉长后,我们往往可从ACF图得到相应的证据)。
究其原因在于,传统有效市场理论认为金融市场自相关函数是以指数幂率的方式进行衰减,而实际上,市场自相关函数通常是以双曲幂率的速度衰减,衰减速度远低于有效市场假设所认为的指数幂率方式,因此,从ACF图上看,虽然滞后期不断变大,但市场的自相关性远未达到可以被忽略不计的地步。
1.2、分形市场与有效市场
由于有效市场假说一直被看作是资本市场理论的主要基石,因此受到比任何一种经济理论都要广泛的实证检验。如前所述,大量经验数据对其正确性提出了质疑,这些与理论不同的检验主要集中在:对EMH正态性假定的检验、对易变性(即:波动率与时间长度幂率关系)的研究、市场记忆性等诸多方面。传统EMH的理论框架是基本线性的市场假设,并在实证分析过程中,主要通过运用标准布朗运动来衡量市场是否有效;但实际市场并不如有效市场理论假设得那么简练,而是经常表现为有偏的随机游走,而这恰恰是EMH分析所忽视的地方。
与有效市场理论相对应的是分形市场理论。上世纪六十年代,美国科学家mandelbrot提出股票市场收益分布并不遵循正态分布,而是具有尖峰胖尾效应。上世纪九十年代,Peters在此基础上,提出了分形市场假设,即金融市场本质上是一个复杂的非线性动态系统:
1)资本市场由数目众多的投资者组成,而且每一个投资者具有不同的投资期限,这就决定了市场受不同投资行为和投资周期的影响;
2)不同的市场信息对投资者产生不同的影响,短期投资者更注重历史信息,而长期投资者更关注基本信息;
3)市场的稳定性主要取决于其流动性,只有当市场是由处于不同投资期限和不同投资水平的众多投资者组成时,流动性才能得以实现;
4)市场价格不仅反映了市场中基于技术分析所作的短期交易,而且反映了基于基本分析对市场所作的长期估价;
5)若市场与整体经济循环无关,则市场本身并无长期趋势可言,其波动主要由交易量、流动性和短期信息决定;若相关,则随着经济周期循环的确定,风险将逐步的降低。
它具有诸多不同于EMH的特点,其中最明显的两个特征是:1)长记忆性(长程相关性),即:过去的信息将对未来产生长期的影响,从自相关性角度看,表现为自相关函数衰减方式的不同(以负指数幂率还是双曲幂率方式衰减);2)标度不变性,即:不同时间标度下具有相似或相同的统计规律,从易变性角度看,表现T^H准则。
分数布朗运动
由于实际金融市场太复杂,无法通过理想的简单高斯马尔科夫模型进行建模,Edgar(1991)在提出分形市场概念的同时,还指出用分数布朗运动可以更准确地刻划金融市场的波动,Peters在此基础上,系统性地提出分形市场假说,并用分数布朗运动来描述金融市场的运行。所谓分数布朗运动(Fractional Brownian Motion, FBM),实际是由标准布朗运动扩展而来:
一个随机过程B_H(t)被称为分形布朗运动(FBM),若它满足以下定义:
其中,0<H<1,Γ(∙)为伽马函数,B(s)为标准布朗运动,而K(t-s)满足:
根据定义不难发现,分数布朗运动B
H
(t)实则是dB(t)的加权平均,其权函数即为记忆核函数K。同时,当H=1/2时,B
H
(t)退化为标准布朗运动;当H>1/2时,由于记忆核函数随幂率缓慢衰减,此时B
H
(t)的运动因此而具有持久性或长期记忆性;而当H<1/2时,情形恰恰相反,导致B
H
(t)的运动具有反持续性。从这个意义上说,分数布朗运动实际是标准布朗运动这一特殊情形的推广(将H值从特殊值1/2扩展到0<H<1)。
此外,对于指数为H的分形布朗运动X(t),可定义其序贯极差:
由于分数布朗运动具有自相似性,则此时其序贯极差亦服从T^H定律。基于重标极差的Hurst指数计算方法的理论来源即基于此标度不变性理论。
不仅如此,分数布朗运动的时间增量还具有如下性质:
1)分数布朗运动的增量均值为0,即:
2)分数布朗运动的增量方差与时间间隔呈幂率关系,即:
3)分数布朗运动增量间的相关性满足:
当H=1/2时,C(T)=0,即:未来增量与过去增量不相关;当H<1/2时,C(T)<0,未来增量与过去增量间负相关,即:过去价格增加(或减少)预示着未来价格的减少(或增加),未来市场大概率将出现反转;当H>1/2时,C(T)>0,未来增量与过去增量间正相关,即:市场大概率将延续过去一段时间中的上涨(或下跌)趋势。而我们对Hurst模型应用的理论基础通常便来自于此
。
Hurst模型的打开方式
3.1、Hurst指数计算步骤
Hurst是一位英国的水文学家,二十世纪初他在尼罗河参与水坝工程(水库控制)工作——需要确定每年水库的放水量,以避免因过多(或过少)放水导致水库水位降低到危险程度(或溢出)。构建模型时,一个自然的想法是假定不可控部分(雨水)流入量遵循随机游走,但由于尼罗河地区的生态系统具有较大的自由度(受诸多因素影响),随后Hurst发现其并不遵循随机游走,并由此提出重标极差法,用于描述分数布朗运动中的参数H。此后,Mandelbrot和Wallis对Hurst理论(尤其是R/S分析方法)作了较为系统的研究,并给出严格的数学描述。上世纪九十年代,Peters则将该方法引入资本市场领域,并取得了较为明显的效果。
对于Hurst指数的计算方法(重标极差法),其计算流程一般分为三步:
1、将长度为N的时间序列(通常为收益率序列)划分为长度为n的A个连续子区间I
a
(a=1,……,A),I
a
中每一点记作R
k,a
;
2、针对不同的子区间长度n,计算A个子区间的平均重标极差:
。其中每个子区间上重标极差的计算步骤:
1)对每个长度为n的子区间,在对相应时间序列作零均值化处理后,计算其累计离差:
2)定义单个子区间上的极差:
3)计算各子区间上的重标极差值(即:对子区间上极差重新标度):(R/S)
a
=R
a
/S
a
,其中,
3、由于样本的平均重标极差值与样本长度之间存在标度关系,即:
因此,对不同时间尺度(即:不同划分长度n)重复以上过程,并将所得的平均重标极差值(R/S)n对n进行双对数回归:
可得到相应的Hurst指数。
3.2、关于R/S分析法
3.2.1 关于周期
所谓的周期性仅仅是我们强加于市场的一个幻相?还是真实存在于金融市场的时间序列(无论是价格指数还是经济数据)中?若周期性存在,周期长度是否固定且唯一?
在金融市场上,关于时间序列周期(或者说循环长度)的分析一直是个十分重要但却始终悬而未决的问题。在传统的有效市场假说中,金融市场价格波动通常被认为遵循随机游走;但后来大量实证研究(Debondt & Summers)表明,金融市场(尤其是股票市场)中大多数时间序列(包括:价格、经济数据等)的波动并不遵循随机游走原则,而是表现为一种均值回复的特性,即:金融市场中大多数时间序列(包括:价格、经济数据等)存在着不断起伏的循环过程。
然而,不同于自然界中的日月交替、四季变化等具有固定周期的周期性循环,金融市场中大多数时间序列(包括:价格、经济数据等)波动(涨跌)往往表现为非周期性循环(即:并无精确固定的频率<或者说具有时变性>,而往往表现为一个平均的频率)。 这一事实早已在各类涉及谱分析(或周期分析)理论的信号处理或计量经济学建模过程中得到印证:在使用各式各样谱分析方法(无论是经典谱估计方法,还是诸如参数型、非参数型的现代谱估计)来解构历史数据,并由此获得若干个固定周期后,通过应用具有相应周期的正弦函数可在样本内获得较好的拟合效果,平均拟合优度甚至可超过70%,但样本外预测效果却往往差强人意。以PPI数据为例,我们可以很轻易地使用现代谱分析方法获取样本内历史PPI数据所包含的所谓周期,并通过引入正弦函数获得良好的样本内拟合效果,而一旦对该模型作外推,则预测误差成倍放大。
更为不幸的是,早期人们对金融市场价格波动循环的研究,却还主要集中在规则的周期性循环上:上世纪六十年代,Granger等人即提出可以通过谱分析理论来研究部分周期性金融时间序列,并发现对于具有显著周期性的时间序列,其功率谱函数在基频及其谐频上的峰值所对应频率的倒数即为其周期。对于谱分析方法,除了其本身具有一定程度的缺陷(存在诸如:频谱泄露、谱线分裂、虚假峰值、分辨率低等一系列问题),它还预设了一个前提,即:假设了涉及经济、价格数据的各类时间序列均由诸多具备不同频率和振幅的正弦波合成。可遗憾的是,目前为止没有任何直观的理由使人相信,金融市场的循环与正弦波或其他周期循环有关,而大多数用于谱分析的时间序列亦不满足可傅里叶展开的前提假设。同时,当周期性时间序列的信噪比较低或时间序列不存在固定周期时,谱分析方法也会变得无能为力。
有鉴于此,近年来,随着系统科学在金融市场中的广泛应用,大量研究发现,金融市场的价格波动实际存在着一种非周期性循环。自上世纪九十年代以来,越来越多的人(Lo, Peters, Cheung, Corazza等)通过引入R/S分析法(Rescaled Range Analysis,重标极差法)来研究金融市场的非周期性循环特征。
3.2.2 R/S分析法(Rescaled Range Analysis)
针对金融市场上的波动聚集性问题,传统的ARCH族模型可以对之进行很好的描述。但是这类模型建立的基础是假定所研究的系统是随机且其分布满足正态性要求,当系统是介于随机性和确定性之间的非线性系统时,这些标准的统计方法就不再有效,此时便不得不诉诸于非参数统计方法。
R/S分析方法就是这样一种已得到广泛运用的非参数统计方法。R/S分析法是由英国水文学家Hurst在上世纪五十年代考察尼罗河流量变化时发现,并被Peters将其推广至资本市场。其主要思想是分析重标度的累积均值离差的标度行为(对于一个在一维时间轴上游走的质点,其累积均值离差实际就是质点随时间偏离起始点的距离)。该方法的最大优点在于它不必假设所测度的时间序列的分布特征:无论是正态分布还是非正态分布,R/S分析结果的稳健性均不受影响。
由分数布朗运动的性质和Hurst指数的计算过程,不难发现,R/S分析法的实质是利用了重标极差值的标度不变性,通过回归得到其在双对数(Log(R/S)N-LogN)图上的斜率,并以此作为Hurst指数值。所谓标度不变性:
对于具有循环(无论是周期性循环还是非周期性循环)特性的时间序列,当时间长度达到循环长度时,恰恰是标度不变性现象消失的开始。在Log(R/S)N-LogN图上,直观的表现为时间序列的循环长度(无论是周期性循环还是非周期性循环)等于偏离幂率轨迹的突变点所对应的时间长度。R/S分析法可用于分析非周期性循环的平均循环长度的依据即在于此。
而实际上,R/S分析法不仅在检测非周期性循环时具有显著的优越性,而且对于周期性时间序列,仍然能得到相应的周期长度。例如,由周期函数得到的离散时间序列y=sin(2πi/1000),可根据R/S分析,得到其重标极差序列(R/S)n,由于该时间序列是由确定性周期函数出发所得(图像上表现为光滑曲线),其Hurst理论值应为1,随着取样频率的增加,Hurst指数逐渐趋于1。同时,在Log(R/S)N-LogN图中,偏离幂率的突变点所对应的时间长度即是周期性循环的循环长度(或者说是该时间序列的周期)为1000。
3.2.3 重标极差法下的Hurst指数计算
回顾§3.1中的双对数回归公式,不难发现,Hurst指数实际指的是当重标极差值与时间长度间呈幂率关系时在双对数图上所对应的斜率值,最终通过回归所得的Hurst指数值与回归所需的数据长度(即:子区间长度上限N)休戚相关:当N过小时,由于回归所需样本(时间标度)过少,导致回归所得斜率项极易受噪声扰动而出现频繁波动(如图12所示);当N过大(超出非周期性循环的平均记忆长度,即包含幂率效应消失的时间点),将导致回归所得斜率项因无记忆数据的引入而产生较严重偏差(如图14所示)。
因此,对于重标极差法下计算Hurst指数,为保证适当的样本数量(时间标度足够),将子区间长度N的上限确定为非周期性循环的平均循环长度,是极为必要的。
3.3、关于Hurst指数期望值与方差
由§3.1中第三步,不难发现,所对应指数平均记忆长度的时变性和起始点选取的可变性决定了,通过双对数回归得到的Hurst指数值大小实际是受起点和终点影响。同时,为了鉴别具有显著分形效应的区域,我们引入Hurst指数期望值和方差的概念。
由于分形市场理论并不以正态分布为前提,因此,传统的算术平均和标准差形式并不适用于Hurst指数的期望和标准差的计算公式。为此,Peters曾在上世纪九十年代得到过关于Hurst指数期望值和方差的经典表达式:
在计算随机游走序列Hurst指数的期望值时,必须采用与计算实际重标极差值时相同的n来计算对应的重标极差期望值,然后根据平均重标极差期望值对n进行双对数回归,得到关于Hurst指数的期望值E(H)。
同时,Peters也给出了Hurst指数方差的计算公式:
其中,N为样本观测数目。
Hurst模型在指数择时上的应用
一般情况下,对于Hurst指数的学术研究总是假定它在所研究的时间序列段中是不变的,显然,一段时间内市场整体Hurst指数对投资决策的实时制定并无实际帮助。而实际上,由于在时间序列的每一个时点,都会存在一个与之对应的Hurst指数,因此,我们通过引入时变Hurst指数,用于对相应指数进行择时判断。
4.1、Hurst模型在指数择时上的应用
(1)数据选取:我们以相应指数的历史周收益率数据为基础;
(2)模型构建:依据相应指数的周收益数据,计算时变Hurst指数(计算流程见§3.1);
(3)多空择时策略开平仓信号:
1)反转开仓条件:当时变Hurst指数值H<LBound且|Resid|<κσ时,反转信号出现;
2)趋势开仓条件:当时变Hurst指数值H>TBound时,趋势信号出现;
3)反转平仓条件:当时变Hurst指数值H>E(H)时,反转信号结束;
4) 趋势平仓条件(以下三条件满足其中之一即可):
α) 时变Hurst指数值H<E(H);
β)当市场为趋势下跌时,时变Hurst指数值H>TBound且Resid>ϑσ;
γ) 当市场为趋势上涨时,时变Hurst指数值H>TBound且Resid<-ϑσ;
其中,TBound=E(H)+σ(H)×δ
1
,LBound=E(H)-σ(H)×δ
2
,Resid为基于相应指数收益数据自回归模型的残差项。
4.2、Hurst模型在指数择时上的业绩表现
4.2.1 Hurst模型在上证综指择时上的业绩表现
对于上证综指,我们以上证综指周收盘价数据为基础,考察其自2006年12月31日至2017年6月30日间Hurst指数的表现,并利用时变Hurst指数制作多空择时策略,在10年半的时间内,Hurst模型共发出20次信号,其中有7次反转信号。平均每次信号的持续时间16.1周,共获得累计33.72倍的收益,年化收益39.80%,而该策略的最大回撤为-18.54%。
细分之下,不难发现,该策略主要收益来源于趋势收益(趋势收益累计达1288%,而反转收益仅143%),究其原因,过去十年半时间内,市场大级别反转出现次数有限,而每次反转持续时间有限,因此来自市场反转所获得的收益较为有限(共出现8次反转信号,累计收益143%)。同时,如果从多空收益角度看,8次做多累计收益达304%,而12次做空累计收益则达735%,原因在于国内股票市场普遍存在涨跌收益不均衡现象,从数据上看周收益数据的偏度小于零,而在分布上表现为明显的右偏结构。
4.2.2 Hurst模型在其他指数择时上的业绩表现
1)Hurst模型在上证50指数择时上的应用
对于上证50指数,我们以上证50周收盘价数据为基础,考察其自2012年12月28日至2017年6月30日间Hurst指数的表现,并利用时变Hurst指数制作多空择时策略,在4年半的时间内,Hurst模型共发出13次信号(其中反转信号共3次),平均每次信号的持续时间12.15周,共获得78.37%的累计收益,最大回撤为-16.19%。
其中,累计35.04%的收益来自趋势判断,而32.08%的收益来自于反转判断。如果从多空收益角度看,6次做空累计收益则达54.58%,而7次做多累计收益15.40%。
2)Hurst模型在沪深300指数择时上的应用
对于沪深300指数,我们以沪深300周收盘价数据为基础,考察其自2013年12月27日至2017年6月30日间Hurst指数的表现,并利用时变Hurst指数制作多空择时策略,在过去3年半的时间内,Hurst模型共发出10次信号(其中反转信号共4次),平均每次信号的持续时间11.60周,共获得191.15%的累计收益,年化收益35.71%,最大回撤为-18.06%。
其中,累计80.38%的收益来自趋势判断,而54.94%的收益来自于反转判断。如果从多空收益角度看,6次做空累计收益则达40.97%,而4次做多累计收益达98.40%。
2017系列深度报告回顾
建投金工深度系列报告之三十五:2017年中期投资策略报告之金融工程篇——量化基本面方法论之再探索与实证 20170626(参见网盘)
详细内容可以参考中信建投金融工程组报告:《深度解析Hurst模型的打开方式》
联系人:王赟杰 wangyunjie@csc.com.cn
执业证书编号:S1440516070001
免责声明
:
订阅者对本订阅号所载所有内容(包括文字、音频、视频等)进行复制、转载的,需注明出处,且不得对本订阅号所载内容进行任何有悖原意的引用、删节和修改。
返回搜狐,查看更多
责任编辑: