投资要点
► 带约束的加权最小二乘拟合:一种解析解法
多因子模型的收益拟合实际上是一个带约束的加权最小二乘求解问题,通常有:直接优化法、二次规划法、解析解法,其中解析解法逻辑直观、运行速度快、可重复性高,是我们更推荐的方法。
解析解法实际上是将回归系数根据约束条件进行简单的线性变换,从而转化为传统的最小二乘求解。线性约束可以分为排他约束、等式约束和一般线性约束,它们都可以用相同的解析解进行求解。
► 一周行情回顾
上周市场先涨后跌,整体来讲涨势较为可观,特别是中小板股票上涨势头明显强于大盘股指。
行业方面,上周仅有银行业取得负收益,电子元器件和农林牧渔行业涨幅均超过10%。
► 市场风格解析
上周波动率、流动性和BP因子重新获得市场青睐,纯因子收益扭亏为盈;规模因子和长期动量因子发生反转,表明市场民心思定后,重拾对中小规模企业的信心。
► 指数风险预测
所有样本指数在未来一个月的年化波动区间在16%-25%之间,相较上周略有上行,其中以中小板股票、成长类指数的风险较大,而偏大盘、价值类股票风险较小。
► 指数成分收益归因
上周表现最好的两只创业板指数,由于其在规模和动量因子上的较低暴露和在流动性因子上较高的暴露帮助其获得一个较好的收益。表现相对较差的三只指数均为 大盘价值 类指数,在规模和动量因子上暴露过高,拖累指数走势。
►风险提示
本报告统计结果基于历史数据,过去数据不代表未来,市场风格变化可能导致模型失效。
► 更多交流,欢迎联系财通金工张宇,联系方式:17621688421(注明机构+姓名)
在实际投资中,多因子模型被广泛地应用到资产定价、绩效归因、风险控制、组合优化、基金评价及资产配置等各个领域,一套完整、精细的多因子系统成为每位量化研究者必备的工具。 “做最实用的研究”,是财通金工给自己的定位 。 我们将在之后的系列报告中,就投资者们最关心也最容易忽略的很多细节问题进行探讨,介绍我们在实际应用中遇到的问题和思考,以飨读者。
我们为本系列报告取名“拾穗”。一周市场风云变幻,和风细雨也好,狂风骤雨也罢,都留下一地故事等待梳理。作为勤劳的搬运工,财通金工从量化视角出发对市场风格进行捕捉、对风险水平进行预测,既是希望能够如拾穗者般专心、踏实地做研究,也是祝愿各位投资者能够在市场收获满地金黄。
本期是该定期报告的第一期, 主要介绍一种解析解方法,直接对带线性约束的加权最小二乘进行求解。 与数值解相比,解析解法计算速度更快、可重复性更强,是一种我们更为推荐的方法。财通金工还提供我们自己编写的接口函数,感兴趣的读者可与我们直接联系获取。
带约束的加权最小二乘拟合:一种解析解法
1
多因子模型认为股票收益是由一系列共同因子来驱动的,Barra USE3版本将股票收益拆解为行业因子、风格因子和特质因子三个部分,Barra USE4版本引入国家因子(又称截距项因子),将股票收益拆解为市场收益、行业收益、风格收益和特质收益四个部分。
截距项因子的引入既是为了方便对全球股票资产进行多因子建模,又能够将市场收益从行业收益中剥离出来,从而可以观察到纯净的行业因子表现情况。然而,由于每只股票在所有行业因子的暴露加总恒等于1(单只股票属于且仅属于某一行业),因此 截距项因子的加入将会导致截距项与行业因子之间存在完全共线性,从而使得模型的解不唯一,传统的解析解法不再适用(矩阵不可逆)。为此我们引入一个约束条件 ,使得所有行业因子收益的市值加权平均为0。
其中,w_i表示行业i中所有股票的流通市值占全市场流通市值的比例,该约束条件的引入使得全样本股票收益的市值加权平均(即指数收益)可以被近似地认为等于截距项因子收益。
在实证研究中我们发现,股票收益存在明显的异方差性,股票的特质波动与其市值之间存在明显的负向关系。为了消除异方差性带来的影响,我们采用加权最小二乘(WLS)对模型进行拟合,回归权重为股票的市值平方根权重。
由此, 多因子模型的收益拟合变为一个带约束的加权最小二乘求解问题 ,该问题的求解通常有如下三种方法:
1)直接优化法:即最小化特质收益的回归加权平方和,在MATLAB中可用fmincon函数进行求解,在Python中可用scipy.optimize.minimize函数进行求解。
注意,此处w_n是指单只股票n的回归权重,而w_i是指行业i内所有股票的市值占全体样本股票市值的比例。直接优化法在逻辑上简单直观,但通常需给定一个初始值及迭代次数,且不一定能保证在达到最大迭代次数之前能够找到最优解,因此即便对于相同的输入而言,采用直接优化法得到的结果尽管十分接近但可能并不完全一致。
2)二次规划法:它实际上是直接优化法的向量求解版本,对应于MATLAB中的quadprog函数,或者Python中的cvxopt.solvers.qp函数。我们以qp函数为例,其输入参数为qp(Q,p,G,h,A,b),对应的二次规划问题为:
加权最小二乘的优化目标是最小化残差变量的加权平方和,因此目标函数可以表示为:
将以上公式结合标准的二次规划问题,即可将参数进行一一对应:
其中,X是表示股票因子暴露的N×K矩阵,N为股票个数,K为因子个数(I为行业因子个数,S为风格因子个数,K=1+I+S),W_n为股票回归权重,它是一个N×N的对角矩阵,对角线上的元素为股票的市值平方根权重,Y为股票在每一期的收益,w_i为1×I向量,每个元素对应每个行业的市值权重,0_(1×S) 为1×s维零向量。
3)解析解法:Ruud(2000)介绍了一种带有线性约束的最小二乘解析解法,该方法实际上是将回归系数根据约束条件进行简单的线性变换,从而转化为传统的最小二乘求解法:
其中,β是一个K×1的向量,即我们需要拟合的回归系数,S是一个K×M的已知矩阵,s是一个K×1的已知向量,γ是一个M×1的未知向量,其中M
Ruud(2000)将线性约束分为排他约束(Exclusion Restrictions)、等式约束(Equality Restrictions)和一般线性约束(Simple Linear Restrictions),我们以一个含有5个回归变量(包含截距项)的模型进行说明:
i)排他约束
若回归中存在如下约束:β_2=0, β_4=0,那么:
ii)等式约束
若回归中存在如下约束:β_2=β_3, β_3=β_4,那么:
iii)一般线性约束
若回归中存在如下约束:β_3+β_4+β_5=1,那么:
在了解了如何对原始参数进行线性转换之后,我们即可给出模型的解析解版本。 假如在回归方程中加入β=Sγ+s约束,那么回归系数可用如下解析解表示:
证明如下:
此处我们定义带约束的自变量X_R=XS,定义带约束的因变量y_R=y-Xs,那么通过如上线性变换就可转换为无约束的最小加权二乘求解:
由此我们可以直接得到原始回归系数:
根据以上推导我们以某日的全市场股票收益对前一个交易日收盘后计算得到的股票因子暴露度进行回归,分别采用直接优化法、二次规划法和解析解法进行收益拟合,我们以散点图的方式比较三种方法得到的结果。由图1和图2可以看到,三种方法得到的因子拟合收益都十分接近,其中二次规划法和解析解法结果完全一致,直接优化法的结果略有不同。 在运行速度上,解析解法的运行速度明显更快,因此我们推荐投资者在构建自己的多因子模型时采用解析解法进行收益的拟合,该方法逻辑简单、运行速度快且无需输入过多初始参数。
一周行情回顾
2
上周权益市场先涨后跌,整体来讲涨势较为可观,特别是中小板股票上涨势头明显强于大盘股指。上周中小成长和 创业板综 指数分别上涨7.21%和7.07%,在所有样本指数中排名前二,而以 大盘价值 为主的上证180价值指数和沪深300价值指数分别录得-0.24%和0.07%的收益,总体来讲上周权益市场风格更加偏好中小成长类股票。
行业方面,在所有29个中信一级行业中,仅有银行业板块在上周取得负收益,小幅下跌1.06%,而电子元器件和农林牧渔行业的涨幅均超过10%,上周分别取得11.02%和10.95%的收益。
市场风格解析及指数风险预测
3
财通金工借鉴Barra模型,选取Beta、规模、动量、波动率、非线性规模、BP、流动性、盈利、成长和杠杆率因子构建收益-风险归因模型,因子定义及计算细节参见附录二。 本部分通过对近期风格因子的收益表现进行分析以期捕捉A股市场的风格变化,同时对财通金工样本指数的未来一月风险进行预测来分析当前A股市场所处的风险水平 。风格因子的收益拆解可参见财通金工专题报告《Barra模型初探:A股市场风格解析》,资产组合的风险预测可参见财通金工专题报告《Barra模型进阶:多因子模型风险预测》。
3.1 市场风格解析
各类风格因子在上周的累计收益可分为日度累计收益和周度收益两种,日度累计收益是根据风格因子的日度收益计算得到,周度收益是将股票在本周的收益率对股票在上周最后一个交易日的因子暴露度进行回归得到的因子纯净收益,二者之间的区别在于换仓频率的不同,前者为每日换仓,而后者在每周最后一个交易日换仓。
表1和图5展示了上周各类风格因子的累计收益和周度收益大小,可以看到,二者十分近似。上周的风格因子相较前一周变化较大, 波动率、流动性和BP因子重新受到市场青睐,其收益扭亏为盈;而规模因子与长期动量因子发生反转,表明市场民心思定后,重拾对中小规模企业的信心。近期Beta因子的表现较为稳健,表明市场整体运转较为顺利。
图6和图7分别展示了最近一个月各类风格因子的净值走势及累计收益,以观察各类风格因子在过去一段时间的持续盈利能力。 整体来讲,在过去的一个月中, 大盘价值 股的表现优于小盘股,高Beta、大市值,波动性低的股票最近能获得较高的收益,然而上周市场风格却明显青睐小盘,我们提醒投资者注意近期风格转换可能带来的风险。
3.2 指数风险预测
对收益的分解仅代表过去,对风险的预测才代表未来。 多因子模型风险预测将股票风险拆解为共同风险和特质风险两部分,在通过稳健调整对共同风险矩阵和特质风险矩阵进行估计后,即可根据指数的成分股权重来估计指数在未来一段时间的波动情况。为了保证结果的严谨性,此处我们直接采用Wind提供的成分股权重数据,而非根据自由流通市值计算得到,尽管二者的结果十分类似。
图8展示了财通金工样本指数在未来一个月的预测波动率,为了方便展示我们将估计的月度波动率进行年化,波动的预测时间为上周最后一个交易日(2019.2.15)。 可以看到,所有样本指数未来一月的年化波动区间在16%-25%之间,其中中小板股票、成长类指数的风险较大,而偏大盘股票、价值类股票的风险普遍较小。
由于在计算股票的风格因子时,我们会对暂停上市的股票、大类因子值存在缺失的股票进行剔除,因此在进行收益归因和风险预测时,并非所有指数成分股都纳入到了模型中,如果缺失股票个数过多或者缺失股票的权重占比过大,将会对模型结果造成较大影响。图9展示了各大指数在模型拟合过程中,纳入考虑的股票个数(权重)占指数成分股个数(权重)的比例,可以看到所有指数的比例均在93%以上,数据质量的拟合较为合意。
指数成分收益归因
4
本部分财通金工对上周表现最好的三只指数和表现最差的三只指数进行归因分析,以观察涨幅较高(或较低)的指数风险暴露是否展现出较高的趋同性以及两类指数的持股风格是否会表现出明显的差别。
表2展示了各大指数上周在各类因子上的暴露程度,可以看到, 上周表现最好的两支创业板指数,在规模和长期动量因子上较低的暴露程度和在流动性因子上较高的暴露帮助其获得了一个较好的收益。表现相对较差的三只指数都是 大盘价值 类指数,其在各个因子上的暴露趋同,较大的规模和在动量因子上的过高暴露,拖累了指数走势。
参考文献:
【1】“An Introduction To Classical Econometric Theory”. Pual A. Ruud, Oxford University Press, 2000.
【2】封面图片来演互联网,为法国画家米勒代表作《拾穗者》
风险提示
5
本报告统计结果基于历史数据,未来市场可能发生重大变化。
报告原文地址及相关报告
原始报告:
证券研究报告: “拾穗”系列(一):《带约束的加权最小二乘拟合:一种解析解法》
发布时间:2019年2月17日
分析师:陶勤英 SAC证书编号:S0160517100002
联系人:张宇 17621688421
下载地址:
链接: 网页链接 提取码:o5zc
相关报告:
“星火”多因子系列(一):Barra模型初探:A股市场风格解析
“星火”多因子系列(二):Barra模型进阶:多因子模型风险预测
“星火”多因子系列(三):Barra模型深化:纯因子组合构建
法律声明
根据《证券期货投资者适当性管理办法》(2017年7月1日正式实施),本订阅号发布的观点和信息仅供 财通证券 专业投资者参考,完整的投资观点应以财通证券研究所发布的完整报告为准。若您并非专业投资者,请勿订阅或转载本订阅号中的信息。若您并非财通证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号中的任何信息。
本订阅号旨在沟通研究信息,分享研究成果,所推送信息为“投资参考信息”,而非具体的“投资决策服务”。本订阅号推送信息仅限完整报告发布当日有效,发布日后推送信息受限于相关因素的更新而不再准确或失效的,本订阅号不承担更新推送信息或另行通知义务,后续更新信息请以有关正式公开发布报告为准。
市场有风险,投资需谨慎。在任何情况下,本订阅号中的信息所表述的意见并不构成对任何人的投资建议,订阅人不应单独依靠本订阅号中的信息而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。本资料接受者应当仔细阅读所附各项声明、信息披露事项及相关风险提示,充分理解报告所含的关键假设条件,并准确理解投资评级含义。在任何情况下,信息发布人不对任何人因使用本订阅号发布的任何内容所引致的任何损失负任何责任。