张序:沪深300增强ETF的投资实践

建榕量化研究
59509-10 10:54

作者:建榕量化研究

题图:建榕量化研究微信公众号


会议:开源一席谈

日期:2024年8月30日

主办:开源证券金融工程魏建榕团队

主题:沪深300增强ETF的投资实践

特邀嘉宾:张序,华安基金量化投资部基金经理

对话实录:

苏良:请简单分享一下您的投资理念和研究框架。

张序:主要就针对华安沪深300增强ETF来讲一讲我们的投资理念跟具体的投资框架。这个产品是我们在2022年底发行的,当时我们做这个产品时的目标是想做一个平替沪深300ETF的产品。跟踪误差要比场外的所有300增强小,我们设置的是3%的年化跟踪误差。并且它的超额收益率要比较稳健,让投资者在季度甚至月度相比于300指数以及300ETF都有不错的超额收益率的体验。所以在构建策略的时候,我们会对组合的相比指数的跟踪误差以及超额收益率的稳定性都做了比较严格的约束和优化。因为我们带着这种目标来做这个产品,所以在之前尝试中发现一些基本面量化的策略是比较难做的。因为基本量化策略的波动比较大,所以我们就没有用这种方法。我们之前在这方面也做了许多研究,之前也在开源金工这里关于基本面量化做了比较多的交流。所以我们主要还是通过机器学习的方法来构建我们300增强的组合。我们对于机器学习主要是用到的股票信息是成交量、价格、资金流等数据,基本上是每天的交易出来的数据作为我们模型的输入端。这也是我们这个产品与之前管理的华安事件驱动量化不太一样的地方。因为它属于量价策略,它的年化双边换手差不多在11倍以上,会比一般的300指增的换手都会高一点,也是主要用到了一些量价机器学习的方法。整体从去年2023年1月11号产品上市以后,我们这个产品运行下来的超额收益率和跟跟踪无差都比较不错。我们的超额收益率从去年上市以来在56只300指增里面排名比较突出,年化跟踪误差是2.5%。这两个数据跟我们之前在做模型时的样本外跟踪是比较接近的。因为我们在样本外跟踪的时候,我们年化跟踪误差控制在了3%,年化超额收益率是在6.5%左右。但我们实盘做下来,基本上比较接近。甚至在超额收益率方面,还超越了我们的一些预期。我们这产品从去年2023年1月11号至今,我们的跟踪误差都是比较稳定的,都是在2.5%左右。去年的跟踪误差大概是2.5%,今年是2.7%左右。稳定性和延续性都是比较强的,超额收益率也是比较不错的。我们这是一套偏量价的模型来去做的300增强的产品,再用到300增强ETF中。

苏良:您的策略中传统多因子模型、行业轮动以及机器学习这三块的比例?

张序:我们这个产品没有用一些行业轮动和多因子模型,主要还是以多因子来叠加机器学习。主要原因是我们从历史的投资,主要是我们之前一直在华安事件驱动量化中进行的实践中,发现行业轮动的跟踪误差还是相对比较大的。但我们之前在构建300增强ETF这个产品的框架时,我们目标是对跟踪误差会有比较严格要求,所以我们就没有用到行业轮动,主要就是一个多因子叠加机器学习来实现的。因为刚刚苏良也提到我们传统多因子模型主要是四个模块,很多投资者也比较熟悉。比如说四个模块中第一个模块是如何去识别有效的因子,第二模块是如何把你识别出来的因子合成,第三个模块是基于控制组合波动的方法来剔除一些beta类或者一些行业的影响,第四个模块是基于你的换手,基于你的目标,基于你的一些偏好之类等等去做优化。这是传统的多因子框架。

而我们在应用机器学习模型的时候。在主要是在第二个模块跟第三个模块做,就是因子合成端和组合波动的管理端使用机器学习的模型来做了。这也是我们在之前不断做了一些尝试最终确定的一种形式,主要只在这两个模块去做。因为像很多私募,包括有些公募,可能在第一个模块就已经也使用机器学习来做的,像通过机器学习、深度学习或者是之前比较老的神经网络来去生产因子、挖掘因子。但是我们测出来在300这个池子里用这种海量的数据来做,在周频维度的选股策略的稳定性会相对不是很强。这里背后逻辑我们也思考了一下,主要还是300这个池子里的机构参与者相对来说会更多元一点。怎么理解呢?就是像很多小票,可能主体的参与者就是散户,但300里面的参与者不仅包含了国内的机构,还包括国外的机构、散户资金、ETF资金等等。我们发现在不同的时点300成分股的定价权、股价驱动的逻辑都是不太一样的,而且这种变化我们如果纯用一些逻辑性很弱的数据来去做,它的风险会比较大,稳定性会差一点。所以在300里面,我们在第一个模块是没有用这种机器学习的方法来做。但不用机器学习方法来做,我们也发现了一些问题。在用机器学习模型的时候,大家都希望因子的输入端,或者是数据输入端的维度的数量级肯定要足够大的,所以在这里我们也找了一些方法来解决。一方面,我们自己的团队话也会挖掘一些因子,另一方面话我们也跟比较多卖方金工团队,像开源金工这边我们也有深度的合作,这种卖方金工挖的因子也是作为我们数据输入端,因为很多金工团队他们定期也会挖出很多稳定性很强的因子。所以我们从两个维度,我们自己挖的和金工团队通过数据支持得到的数据库,就把它扩充为1000多个因子。通过这种云端输入,我们觉得解决了模型第一个模块数据量不够的一个问题,这样也替代了在300里面用机器学习生成因子效果不太好的一些问题。然后像机器学习的应用也跟各位投资者简单介绍一下我们在300增强ETF的具体情况。我们之前也开发了比较多策略,有偏分类的机器学习模型,也有一些深度模型,这些模型和策略跟踪下来效果都还是比较不错的。目前,我们300增强ETF用到更多还是一些分类模型。

苏良:请简单谈谈传统指数增强以及增强ETF的异同点,可以从投资的角度分析一下不同产品的优势。

张序:公募这块在指数增强的布局应该是特别早的,主要是一些场外的产品。然后从21年公募开始布局比较多的是一些增强ETF,像沪深300增强ETF。指数增强ETF名字包含ETF,所以他是具有ETF特征的,就是可以让投资者的在场内的话做一些实时的交易。做实时交易的好处就是让投资者资金的运行效率更高,你就不用每次以收盘价买一个产品,而是可以更灵活的选择一些盘中的价格,它的灵活度相对说比较高。然后在费率上,因为ETF费率相比来说是比较低的,所以它跟指数增强有这样的一个区别。但我们这个产品与300ETF有个不一样的地方是我们的目标不是紧密的跟踪沪深300指数,而是带有增强目标来做的,这跟300增强它的目标是一样的。由于我们这种ETF形式,我们跟300指数增强还有个不太一样的地方是我们的跟踪误差也会控制会更严格一点,来方便投资者得到一些中短期持有的收益。所以我们这个产品是要去做一个比300ETF更好,比300指数增强更稳的总目标来做的。然后在管理费率上有一个不一样在于300增强ETF的管理费大部分基本上都是0.5%,而绝大部分场外300指数增强管理费是1%左右,所以相比来说,300增强ETF就会有50bp的费率上的超额收益。买300增强ETF本身就能比300指增多50bp的超额收益率,这对投资者来说也是比较不错的超额收益来源。此外,这种模式不仅对投资者,对我们管理人的话也是有好处。因为投资者申赎这些基金都是实时买卖,在仓位上也不会对我们造成比较大影响。举个例子,比如说我们这个产品今天有位客户买了比较大的额度,我们当时就已实时地经转换为股票持仓,仓位基本跟我们开盘的时候一样。但是300指增的场外产品是以收盘价来买入,这会导致我们在第二天的仓位被动降低。300增强ETF降低了这种大额申赎对产品超额的冲击和影响,这是我们这个300增强ETF和场外300指增的区别。

苏良:如何评估和选择量化模型和因子,以确保其有效性和可复制性?

张序:这个问题我感觉是基本上大部分做量化的同行都会遇到的令人头痛的难题,尤其是在做这种机器学习模型的时候。模型在样本内、样本外的表现都比较稳定,但在实盘的时候也会有延续性不太强,或者甚完全不太一样的情况。我们是这样解决的,首先我们在评估和选择这种量化模型的时候,尤其是在做这种偏量价的模型,我们更加注重了因子的稳定性而非是它的超额收益率,也就是我们对胜率或者对最大回测的指标看的权重会更大一些。因为我们发现在做这种机器学习端到端模型的时候,核心还是需要输入数据的稳定性比较强,这样放入到黑盒模型中相对来说更有保障。这是我们在过去选择量化模型或选择多因子模型时会更看重的点,此外也会对高波动或高收益的因子会给比较强的惩罚系数,主要也是防止它进入到我们这种300增强ETF的产品策略中。这些是我们在做量价模型上因子和模型的评估和选择方法,在因子的生成端,也就是挖掘因子跟生成因子上面,我们没有采取一些很暴力的方法来做,主要也是从我们更希望因子有更好的稳定性的出发点来考虑的。

苏良:在管理基金时,如何平衡收益和回撤,以及如何在不同的市场环境下调整仓位?

张序:首先跟各位投资人就是介绍一下我们对收益和回撤的一些理解。我们这边也做一些基本面量化的产品,以及就是这种偏量价的指增产品。这两个方向上我们思考的方法方式还是不太一样的。举个例子,比如说偏基本面量化使用行业轮动的华安事件驱动量化产品,我们对标的是偏股混合指数。因为主动基金和基金的中位数的偏离是蛮大的,所以在这块我们对风险控制的就不会像一些像沪深300增强ETF这么严格的控制。我们发现一些基本面量化策略在风险控制不这么严的环境下,它的收益率是相对来说比较不错的,比如说行业轮动模型、风格轮动模型。但我们也做了相应的方法去平衡它的收益和回撤,平衡的基准主要也是基于我们池子里面的波动来调整相应的行业暴露度。

我们这边管理的300增强ETF就会相当说很严格了,因为我们之前要做的目标就是跟踪误差要比场外的300指增更低,并且还需要能够提供很稳定的超额收益,所以我们在这里就会有比较严格约束。我们在第三模块中我们会剔除行业大类风格。这个剔除我们有两个切入角度,第一个角度是动态的剔除。基于我们alpha因子近期和风格类因子的相关性来剔除它在风格上的暴露。另一个角度是缩短回看窗口。我们今年跟去年都运用了并且觉得比较不错的,是在某些时候alpha因子跟风格因子的相关性会比较大,这也是为什么今年大家看到在微盘股的大幅波动下私募量化的超额收益率出现明显的波动。举个例子,比如说我们做出来一个alpha因子,发现它和小市值因子的相关性是0.2,我们将alpha因子减去0.2倍小市值因子暴露,然后得到基于统计关系不含小市值风格的alpha因子。但有些时候当市场出现比较大的波动,比如说小市值因子大幅回撤的时候,你可能测出来你alpha因子和小市值的相关系数变成了0.8,但你之前是按0.2来去剔除的,那它还要0.6的小市值风格暴露你没有剔除,这就是最后表现出来为什么很多量化指增在微盘大幅回调时也出现明显的回调。所以基于这种方案,我们也做第二个管理,就是会缩短alpha因子和风格因子相关系数的回看窗口,这会帮助我们更快的剔除掉beta因子对alpha因子的干扰和影响。我们在超额收益率alpha因子端的风格上的剔除主要是通过这两步来做的。在构建策略之后我们这样做的原因是更加注重这个产品超额收益率的月度胜率和稳定性,我们的产品运作下来月度胜率是在85%。

在市场的仓位调整上我们这边的研究半径相对来说比较有限,所以更多还是在行业中观和微观上,宏观上来看,我们基本上都是高仓位来运作的。

苏良:如何看待未来量化投资的发展趋势和挑战?

张序:我们觉得未来人工智能模型这块对量化投资的赋能会越来越大,它不仅在人工智能最擅长的量价领域,会比较强的赋能,另一方面话他在基本面量化上我们也在做一些研究,也觉得在未来会是比较不错的人工智能赋能的一个方向。很多投资者对于这种非结构化的数据也可以通过一些AI模型来进行学习、挖掘出一些不错的信号。这也是我们觉得基本面量化未来一个比较不错的方向,就是去对一些非结构化数据的研究和处理转化为因子,这是我们觉得基本面量化的一个应用。然后量化投资这块,这几年国内发展也是蛮迅速的。如果从全球维度来看,从最开始的统计分析,像均值方差等等,到后面的时间序列的研究,然后到机器学习模型,就是2014年左右用的比较多的一些分类器等等,然后到后面的AI大模型,这个发展阶段大家看到模型的复杂度和能学习到的深度也是越来越复杂、越来越深入的。但有一个问题,也是一个挑战,因为模型复杂度增加之后对于基础设施的要求或者人力的要求也是会不断增加的。比如说,像芯片、数据库等等。因为我们模型越复杂,它就必然会涉及到你的数据维度一定要不断扩充,以及我们的运算的效率一定要提升。这就是我觉得是可能也是未来的一个挑战,就是如何更好的提升数据的丰富度。这个问题近几年我们同行都在交流,未来我们量化投资这个行业会是怎么样的?结合当前的市场,大家也发现最近市场的行业、风格这种bata类收益的轮动速度是比较快的。我们觉得量化投资是有优势的,在风险管理上也是具有体系化的一些控制方案。我们不仅是在创造收益的模型端去做一些研究,我们在组合风险的一些管理端也可以结合一些量化模型,以及我们也可以去通过机器学习模型来做一些研究和开发。

苏良:另外,想请教您关于市场上讨论量化是“赚Alpha的钱”和“赚Beta的钱”两种不同观点的看法。

张序:我们作为投资者来说,我觉得我们主要还是在做alpha。为什么觉得我们是在做alpha呢?首先我们在组合的过程做了管理,我们会主动剔除beta类的因子。比如说我们开发出来了一个alpha因子,我们会把它跟其他风格的因子,像市值风格、成长风格、动量风格等等,去做一些相关系数或相关性的研究。然后相关性研究之后我们会把这些风格因子,或者行业因子剔除。这样做出来的alpha因子相对来说超额收益率会更加的稳健。但当我们在注重alpha的时候为什么有些投资者会觉得我们也在赚beta的钱呢?核心原因就是我们剔除的方法存在历史依赖性,简言之就是alpha因子和风格因子的剔除基于过去的相关性来剔除的。比如过去三个月、过去一年alpha因子和beta因子的相关系数来剔除。但这个相关系数它本身就不具备很强的稳定性。比如我们开发alpha因子,它跟动量类的风格因子的相关系数是0.3,在它未来时盘中它的相关系数可能是在0.2-0.4来回波动,或者在极端风险的时候,他可能会到0.6这样的波动。这也就造成我们是基于过去的统计规律来剔除,但实盘中alpha因子跟风格因子的相关系数会在我们确定的均值上来回震荡。在某些时候我们发现我们的alpha因子可能会跟当前的一些风格会有一定的共振。就比如说刚刚也提到像今年的春节和去年一段时间,当时小市值因子很强的时候,很多alpha因子的超额收益率也是创了历史极值。相关系数的极端变化的时候,大家观察到了不一样的点。所以在这块我们刚刚也提到去降低beta对alpha的干扰。或者是作为我们量化投资者,为了让我们的alpha更加纯粹,我们也需要花比较多精力对这种风格的因子做一些研究。我们也在做一些相应的研究。比如说像风格轮动这一块,包括行业轮动它也带有比较强的风格类的特征在里面。我们也在做这种基本面的量化研究来帮助我们更好的理解beta类风格因子,帮助我们更加稳定地剥alpha中的一些beta。

苏良:请介绍一下华安量化团队目前的人员分工情况和产品布局情况。

张序:我们这边是有好几个研究方向,有两个组在支持我们这边的一些产品。其中一个组就是基本面量化,这个就是之前也跟很多领导汇报过我们的华安事件驱动量化产品,就是通过一些宏观、中观的量化投资策略来去做一个稳定战胜885001的一个主动量化产品。这个产品我们在过去五年在主动量化基金里面累计下来的排名差不多是前1%,在公募的偏股混基金里面排名前5%。所以我们这个组的在这方面也是做了比较多的研究,并且我们有一些行业轮动的投顾或专户也是这个组来支持的,所以人数会相对比较多一点,有七名同事在做基本面量化。但另一个组是偏硬核的、做人工智能的,主要就是我和那个相对IT能力比较强同事在支持我这边的300增强ETF产品以及我们有指数增强专户的一些产品,来去做一些高胜率、超额稳定性比较强的策略。我们这个量价机器学习团队人数可能相对比较少,所以我们也是和同行的卖方金工团队,像开源金工,也是做了一些因子数据库上的合作来做一些降本增效的处理。但我们这两个组在研究平台上和底层数据上都是共享的,并且我们也是在模型端都是在想如何相互共赢、相互合作的形式来做的。

(全文结束)

(纪要整理:傅绎达)


版权声明:文章版权归原作者所有,部分文章由作者授权本平台发布,若有其他不妥之处的可与小编联系。

免责声明:
您在阅读本内容或附件时,即表明您已事先接受以下“免责声明”之所载条款:
1、本文内容源于作者对于所获取数据的研究分析,本网站对这些信息的准确性和完整性不作任何保证,对由于该等问题产生的一切责任,本网站概不承担;阅读与私募基金相关内容前,请确认您符合私募基金合格投资者条件。
2、文件中所提供的信息尽可能保证可靠、准确和完整,但并不保证报告所述信息的准确性和完整性;亦不能作为投资决策的依据,不能作为道义的、责任的和法律的依据或者凭证。
3、对于本文以及文件中所提供信息所导致的任何直接的或者间接的投资盈亏后果不承担任何责任;本文以及文件发送对象仅限持有相关产品的客户使用,未经授权,请勿对该材料复制或传播。侵删!
4、所有阅读并从本文相关链接中下载文件的行为,均视为当事人无异议接受上述免责条款,并主动放弃所有与本文和文件中所有相关人员的一切追诉权。

0
好投学堂
第一时间获取行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「好投学堂」,或用手机扫描左方二维码,即可获得好投学堂每日精华内容推送和最优搜索体验,并参与编辑活动。

推荐阅读

0
0

评论

你来谈谈?
发表

联系我们

邮箱 :help@haotouxt.com
电话 :0592-5588692
地址 :福建省厦门市湖里区航空商务广场7号楼10F
好投学堂微信订阅号
扫一扫
关注好投学堂微信订阅号
Copyright © 2017-2024, All Rights Reserved 闽ICP备19018471号-6