与市场主流呈低相关性.
自4月底A股反弹以来,量化指增策略配置性价比凸显。近一周微盘股指数大涨2.94%,据火富牛最新跟踪数据统计,量化指增策略普遍有超额收益,超额大多分布在50bps-100bps之间。其中量道**1号位列于1000指增(中频价量中高换手)组,该组别超额收益平均值为0.95%。
通过火富牛管理人产品相关性分析,量道投资与市场上一些主流管理人的超额收益相关性比较低,平均超额收益相关性可以降至约0.1左右。即使在面对一些大幅回撤或区间回撤时,策略对微盘股的回撤并不敏感,从指增策略表现来看,超额收益表现仍然维持得相对稳定。
Q&A
Q:为什么不是根据市场微观结构数据做一些非常高频的策略,而是通过微观结构加工工程的一些特征去生成因子,再去做出预测呢?
A:我们构建组合的一个最早出发点是要同市场上其他管理人形成一定的配置价值,我们的量价策略要与其他管理人形成很好的低相关性。
除了采用不同类型的机器学习模型之外,最重要的一点在于这个模型的预测时间都是发生在下午的,主动避开交易上大家认为最拥挤和阿尔法获取最好的时间段。我们有一个经验认为,像小盘股或微盘股的阿尔法表现最好的时间点应该是在每天开盘或上午的交易时段。在这个时候,大家可能已经获取到集合竞价的信息或集合前些天的数据,从而对小盘股的超额有了较好的预测。而我们刻意避开这个时段的好处在于:首先策略可以跟大家形成一个很好的互补;其次,我们无需参与硬件和低延迟技术方面的激烈竞争,从而避免了资源的浪费。因此,我们策略并不会倾向于选择小盘或微盘股票,因为我们的决策时间与其他管理人不一样。
Q:小微盘的暴露比较少,并且有自己的一套风控模型,是否可以对这方面再展开介绍?另外,节前大量微盘股暴露导致流动性危机,这波危机是如何度过的?讲解一下Barra同A股比较有特色结合的风控?
A:Barra提供的这些因子基本上可以涵盖传统意义上市场所有交易领域的风格,但是A股市场具有较强的概念和风格的创造能力,有很多概念直观上很难用一些风格来解释,例如去年市场炒作的“龙字头”,就无法用Barra来解释,而且这种风格的可能会随着时间的推移形成实实在在的风险;还有就是“茅指数”,茅台从行业或简单的Barra因子角度来看,也是很难解释的。
因此,我们会考虑两个方面:一方面,采用动态跟踪机制,当某个概念在市场中受到广泛关注,就会开始考虑这个概念是否太拥挤,我们的风控团队就会将其列入观察范围;另一方面,当市场关注某个风格是不是过度拥挤时,是否马上进行管理或限制它。实际上,这种做法并不现实,虽然我们可以看到风险,但很难准确预测风险事件发生的时间点。
根据以往的交易经验,大家普遍认为一个趋势或风格的巨大转变往往不是一蹴而就的,而是伴随着高位的巨幅震荡才会出现的。所以我们做的第二个事情是如何管理这种情况,首先需要跟踪这个策略,当我们认为该策略值得跟踪时,将其加入到优化器限制范围内。在管理过程中,我们会关注这个风格的波动率,在波动率不断提高的时候用风险平价的方式来限制它,最终将其限制在较小的范围内。例如,某个风格可能在膨胀中的过程中,但如果波动率没有大幅增加,我们依旧会正常进行交易,只是敞口会比其他管理人较低。
Q:一个风格在形成泡沫之前或泡沫加速时,可能会去参与吗?例如去年微盘或小票这种风格?
A:在一个风格泡沫形成之前,我们可能还是会参与交易,因为此时尚未触发模型的预警机制。例如,去年微盘或小票风格,初期开始还没有很拥挤的时候,我们会去参与一点。我们参与的方法是动态的管理,采用风险平价的方式,首先设置一个最大敞口,例如去年微盘我们就设置了这样一个上限。除此之外,我们还会设置一个最大风险暴露值,在风格的波动率上升时,敞口就会不断被压缩,这个方法来自于比较传统的交易经验,类似于CTA交易的做法,通过波动率平价来跟踪风险,在获取超额收益和控制风险之间找到一个均衡点。
Q:微盘股是一个非常显著的风格,近期是否有发现一些比较有可能形成泡沫趋势的风格吗?
A:我们在观察很多类似的风格,微盘风格本身已经触发过较大的风险,目前我们的选股模型已经排除掉了绝大部分的微盘个股。除此之外,我们还在观测中特估、红利股等风格,但是目前来讲,这两类股票都没有进入我们觉得的真正的正反馈风险的情况。所谓的正反馈风险是指股票价格不断加速上涨,直到形成泡沫,例如,当时的茅台或宁德时代一样,直观上这种泡沫的体验,就是任何信息都会转化为利好茅台或利好宁德时代。目前我们跟踪的这几个风格,还没有到严格限制的阶段,我们认为目前情况还在可控范围内。
Q:节前微盘股风险,还有非线性市值或成分股占比风险,需要去预防这个风险吗?
A:成分股占比确实是一个很重要的概念,节前这波行情其实是我们没有经历过的一个行情,实际波动是远超出我们的预期。通过控制成分股占比,在很大程度上可以减少这段时间的风险暴露。但是我们认为,成分股暴露应该是一个结果,而不是原因。如果把市场主要风格控制的比较严格的情况下,成分股暴露自然会保持在比较严的范围内,那我们的目标是尽量根据模型自然的结果去控制成分股暴露。
此外,在风控方面,我们也考虑到很多客户可能会有自己的定制需求。针对这一点,我们做了充分准备,包括提供不同风控选择的指增策略,例如0.6倍的成分股持有,或包括50%、60%、70%的成分股持有等。我们都有进行测试,这些定制化的策略的表现也仍然不错。总体而言,我们并不会过于偏向于某种市值暴露。
Q:在策略上比较创新的,相对比较传统的机器学习模型和捕捉联动关系的机器学习模型的结合,可以举例说明这两种模型比较适应什么行情、各自的占比是多少、以及这种模型组合后体现的效果如何?
A:我们大约在去年年底引入了图神经网络模型,图神经网络的特点是对短期行情爆发的反应速度会很快。举例来说,去年3月底发生了一波非常强劲的AI行情,图神经网络模型能够在这种行情下迅速做出反应。另外,去年还出现了一些中特估、红利股、减肥药等概念股的行情,而图神经网络模型也很好地捕捉到了这些行情。
引入关联图谱后,与普通的量价策略会形成互补。从模型的根源上看,量价机器学习策略更倾向于反转或逆向策略,其逆向特征更为明确。例如,微盘的超额收益很大程度上来自于这种反转的结果,通常在微盘区域的股票,往往是因为之前表现不佳才会调入到全市场最小的400个股票里,这时大部分的超额收益是来自本身反转的一个力量。这就是典型的量价机器学习策略的一个特点。而引入图谱后,它将市场上四五千个股票分成几十组或更多组,每组内股票的相关性非常紧密,在这些组内可能又会出现局部的反转。例如,白酒的龙头茅台,当茅台大涨时,其他白酒股票的涨幅通常较低,模型就会倾向于增加其他白酒股的配比。整体而言,这种方式间接实现了对行情风格的跟踪。
图神经网络模型的优势在于,其能够在某一风格特别强势的时候迅速做出反应。例如,在小微盘节前的踩踏行情中,那个时间点的收益是很差的,反应出来就是会低配这些股票,所以超额回撤会比较低;而在节后的反弹行情中,则可能会有相反的调整。这也是为什么在这一段时间内采用图神经网络模型表现比较好的原因,通过引入图谱,把自己变成更擅长跟踪短期风格行情的策略。
Q:拉长维度从一整年的周期来看,图神经网络和传统的机器学习模型的贡献比大概是多少?
A:总体来说,目前基本上是等权分配给这两个子模块,每个子模块大约占整个投资组合的35%左右。从收益贡献比来看,它们差不多,但各自有着不同的特点。
图神经网络的特点是在平常时期表现可能比较一般,可能有10个月是跑输普通神经网络的,但是中间2个月如果有比较极端的风格行情时,图神经网络是远远跑赢普通策略的。而普通的量价机器学习策略恰恰是相反的,所以将这两种策略组合在一起后,可以将整体曲线平滑的非常好。
Q:对于一些另类数据及舆情数据的积累,舆情数据结合一些价量模型,能举个例子说明下这两个是怎么结合在一起的?
A:首先在舆情系统中,信息争议非常重要,我们发现舆情数据对于关注度较低的股票影响更大,这些股票本身舆情信息就比较少,因此一旦出现乐观或悲观的舆情数据,其影响会更加显著。从结果来看,与信息论的理论是相符的。其次,舆情本身的情绪值并不是最重要的。大多数舆情数据都是在盘后发布的,而每天做出决策的时间也是在盘后。
在使用舆情数据时,我们会观察股票在有信息增益的舆情数据发布后是否有变化,比如一个比较乐观的股票预期或营收增长,我们会观察前几天的量价特征与当天盘中发生的量价特征是否有发生明显的改变,这两者的反差是我们特别关注的一个点。机器学习会对这一点进行评估,如果一个乐观的舆情并没有推动股票价格向好的方向发展,那么可能会认为这只股票本身的量价趋势较差,进而对其持有一种较为负面的评价。这个方法比较符合主观的预期,因为我们通常会认为股票在利好舆情发布后应该有所变化,如果没有则可能存在其他负面因素影响。
Q:这类情况是发生在一些关注度比较低,或大家没有充分定价的一些股票上,如茅台、招商银行这种信息争议会比较少?
A:越受关注的股票,它的舆情信息增益会越少,但这也是相对的,比如特别大的股票某一天可能会有非常多的舆情信息,那信息增益可能也是比较大的。但通常来讲,在小股票上会特别明显,因为小股票平常的舆情就会比较少,突然某几天非常密集出现很多,总体上反馈就会比较明显。
Q:舆情或另类数据对于阿尔法的贡献在国外是相对比较成熟的,而国内可能相对还是处于起步阶段。您怎么看呢?
A:我们早期也是希望能够直接利用舆情信息来指导一些因子的开发,或是将舆情的情绪值作为特征或基本面因子来使用。但我们发现实际结果并不是特别理想,可能是因为我们国内市场的特殊性。我们发现将舆情作为标签,结合到量价数据中,效果反而非常好,这种方法可能也更符合我们A股市场的生态特点。
Q:前段时间比较火的大模型Chat GPT或现阶段国内炒作的Kimi,这些能够开始落地应用到量化股票策略的舆情数据里吗?
A:实际上,目前我们并没有实现端到端的学习,所以我们之前与郭彦东博士进行了比较深入的合作,他之前主要工作就是在多模态大模型上的一个工作。那我们引入他的一个合作,因为我们相信A股市场其实是有很多不同维度的数据,包括文本、行情数据、分析式的数据,甚至一些图表数据,如K线图等,都可以作为多模态学习的输入数据。
在这方面,我们还处在探索阶段,这是一个比较长期的项目,希望将来有一天能够真正实现投研领域的端到端学习。但目前这个阶段,我们还是持谨慎态度。因为交易市场的数据还是比较有限的,实盘的模型和策略里我们还是更坚持对每个环节进行详细的基准测试,以及强调各个模块的生命周期管理,这些都是基于我们目前的基础来做的。未来AI技术可能会有更大的进展,但目前我们仍需要不断探索。
Q:现在团队投研是如何分工或投研框架机制是怎样的,团队的合作机制是怎样的,偏流水线还是项目制?
A:现在我们整个投研团队大约有16名正式员工,再加上即将入职的一名应届生,其他还有一些实习生。其中,IT的人员大概有4名,其余的都是投研人员。
在分工方面,数据处理肯定有专门负责的人员,其他的环节更像是一个流水线。从投研跟交易的角度来看,我们非常强调每个环节之间不要完全脱钩。比如因子挖掘,我们有专门负责高频特征提取的同事,他与中频因子挖掘的同事的工作是紧密联系在一起的。比如,我们挖掘出一些新的因子,就需要关注它们所使用的数据以及这些数据的特征。另外,某一类标签的因子在机器学习模型中如何应用,也是我们非常紧密沟通的一点。总体上,我们是采取类似流水线的做法,但我们是比较弹性的流水线,各个环节之间的沟通非常频繁,工作中如何降低沟通成本是我们非常看重的。
Q:这波量化踩踏出清了不少私募,对之后整个行业的生态展望是怎样的?去年私募暴露小微盘在做超额,这波出清后大家会有什么变化?今年是大盘风格还是小盘风格,及主观多头是否会逆袭?
A:对于大盘风格还是小盘风格的问题,从微观结构来看,目前市场仍然偏好红利股和小市值股。小微盘股在节后表现较好的原因可能是市场风险已经基本出清,可以看到微盘股的市值中枢下降很多,甚至倒退到一年半以前的状态,所以这段时间小微盘的表现仍然是比较好的;就红利方面而言,从微观结构上观察到,许多机构投资者持续涌入这些红利特征比较明显的股票上。但从主观上来看,这种趋势能持续多长时间是很难预测。从市场的微观结构上看,目前投资者对这两种风格的偏好度还是比较高的。
另外,关于整个行业的发展,之前许多管理人在风控方面犯了一些错误,在风控模型上面对历史数据的依赖度太高。从历史数据的角度来看,可能并没有选错,比如最近几年将size或微盘的口径稍微打开一点,确实可以换取到较高的超额收益。如果市场是静态的,那么从历史数据的角度去看,这样是性价比很高的。但是市场跟我们投资者是在互动的,行为相似的投资者不断进入市场,最终可能导致出现较大的踩踏。这种情况在A股的历史上是发生过很多次的,相信经过这一次后,所有管理人都会意识到这个问题,大家的风控技术会得到提高。修复了风控上的bug后,预测模型的优势仍然存在,量化策略的优势还是比较大的。只是大家会更谨慎一些,在风控方面会投入更多资源,整个风控模型会更加细致,考虑的因素也不会那么简单。对于整个行业来讲,有望迎来更加健康的发展。
直播回放:【策略交流】极端风险下指增策略的风险控制-结合中国市场特色的风控
阅读管理人详细尽调报告
加入量道投资管理人交流群/
管理人对接/联合尽调