博道基金杨梦:经典与 AI 的碰撞—博道指数+进阶之路

量化藏经阁
7262024-02-29 09:50
好投课代表敲重点啦!!!杨梦是博道基金的量化投资总监,拥有12年证券、基金从业经验,其中有4年专注于量化研究,8年从事量化投资管理。曾荣获2016年私募“金牛奖”和2022年中国基金报英华奖的殊荣,被誉为“金牛”基金经理。

作者:量化藏经阁

题图:量化藏经阁微信公众号


嘉 宾 介 绍

杨梦:博道基金量化投资总监,12年证券、基金从业经验。其中4年量化研究,8年量化投资管理经历。

“金牛”基金经理。私募阶段所管量化产品曾获2016年私募“金牛奖”,2022年获中国基金报英华奖“三年期指数增强最佳基金经理”。

人才梯队完善,专业背景扎实。博道量化团队目前共5名成员,包括自主培养以及从外部引进的优秀量化人才,成员均毕业于清华、北大、复旦等知名院校,具备扎实的专业素养。

平台赋能,分工协作。基于博道统一的大研究平台和数据平台,量化团队各成员分工明确,各自主攻相关研究方向,通力协作,不断丰富完善博道“指数+”系列的模型体系,力争更多元超额收益来源。

图1:博道基金杨梦简介

Image

资料来源:博道基金

以下发言稿整理自博道基金杨梦女士在国信证券2024年度策略会金融工程分论坛的发言实录:

大家下午好,今天我分享的主题是《经典与AI的碰撞》,主要是基于我们博道基金量化投资部这些年在模型和量化投资理念上的升级迭代,和大家分享一下这个过程,以及我们对AI投资方法的一些感悟和理解,毕竟AI投资无疑是近年来量化投资方法论领域中一个热门且具有巨大潜力的方向,我今天想与大家探讨的,也包括我们在这一领域的尝试和经验。

一、个人和团队经历

首先是个人经历,我2011年从浙江大学硕士毕业后便加入了一家公募基金,从事量化研究工作,此后一直专注于量化投资领域,到2014年加入博道投资,也是博道基金的前身,当时它还是一家私募公司。

2014年到2018年,我在博道投资一直从事私募业务,在这段时间里,我开始进行多因子模型的实盘操作,并着手构建博道量化投资的基础体系,2017年我们获准设立公募基金公司,2018年获得公募业务许可并正式开展公募业务,然后我就被调往公募部门,负责筹备和发行公募量化产品,回归公募后博道基金第一只发行的就是由我管理的量化产品博道启航。因此,我的整个投资生涯都是在博道度过的,而且我的量化投资和研究背后有一定私募基因。

图2:博道基金产品体系发展历程

Image

资料来源:博道基金

目前我们的分工体系也保留了私募的一些特征,特别是在分工协作和考核方面。分工体系分为两个部分,第一套分工体系是分域研究,有的人专注于基本面研究,有的人专注于算法研究。在这种分工下,每个成员从最初的研究一直负责到最终能够实际应用于交易的策略或因子,在自己的专业领域内不断深入拓展。

第二套分工体系仿照私募的流水线模式,私募基金通常有六个环节,在我们的体系中将其简化为四个环节:特征工程、模型拟合、因子合成和组合构建。团队成员各自投入部分精力,参与流水线的各个环节,最终以差异化的结果体现在模型成果上。

二、产品体系

自2018年发行第一只公募产品以来,我们现在已经拥有一个比较完善的产品体系,也确实投入了很多心思来布局产品,希望为投资者提供一个完善的贝塔层面的产品线。目前博道基金的产品体系分为三个系列:主动量化、宽基指增和赛道指增

图3:博道指数+产品体系

Image

资料来源:博道基金

2.1主动量化

与大家通常意义所理解的主动量化略有区别,在我们内部,“主动量化”这个系列是旨在对标所有主动选股型权益基金的量化产品,希望长期而言能实现对主动管理型产品平均业绩的超越,无论是内部考核还是运作方式,都是以此目标为导向。为了实现这一目标,我们采用了三种完全不同的策略,我们内部称之为“三航策略”。

2.1.1博道启航

博道启航是我们2018年发行的第一个产品,当时的思路比较简单,就是将我们私募阶段实盘运行最久的两个模型——中证500指数增强和沪深300指数增强结合起来,打造一个市值风格均衡的产品。

这种做法在长期来看是可行的,因为大家主要比较的是超额收益,无论与哪个宽基指数做比较,只要长期能保持有竞争力的超额收益,风格转换后优势就会显现。然而在短期内,尤其是1-2年,甚至2-3年,主动选股型基金的平均业绩与宽基指数会存在较大的偏差,导致我们的贝塔存在较大的偏离。

考虑到这种模式在贝塔层面的局限性,我们后来对第二个产品“博道远航”和第三个产品“博道久航”进行改造时思路也有所变化。

2.1.2博道远航

首先来谈谈“博道远航”。我们内部将博道远航这只产品的策略定义为“基金指数增强”,其旨在针对主动偏股基金的平均业绩水平,利用多因子选股模型,追求在较低的跟踪误差水平下实现对平均业绩的超越。

实现这一目标的第一个难点在于如何准确表征主动偏股基金整体的平均业绩,因为目前没有一个现成的股票指数能够完全代表所有基金的平均业绩。

为此我们经历了两个阶段的尝试。第一个阶段是2021年6月份到2022年10月份,我们借鉴了国信证券研究报告中“优选基金”方法,在一个评分体系下,选择最优秀的前20%的基金经理,将他们的持仓合并,形成一个名为“优选基金重仓股指数”。这个指数确实达到了与885001指数持平,并且基本上能够跟随其波动的目的。但是实盘下来发现,“优选”这一步骤不可避免地会产生偏差和波动,该拟合指数本身就对885001有大约5%的跟踪误差。所以我们在2022年12月份对基准拟合的方式又进行了改造,不再进行优选基金经理这一步骤,而是直接将885001成份内的全部基金进行日度持仓穿透,并通过持仓补全和净值拟合的手段来一定程度上缓解基金持仓公布的滞后性。这些技术手段应用于单个基金时可能不够精确,但是,如果将所有基金的数据汇总起来,就可以追求一种模糊的正确性。

自从2021年6月开始改造以来,“远航”产品已经运作了两年半的时间。在保持大约5%的跟踪误差的同时,实现了6%左右的年化超额收益。

2.1.3博道久航

第三个产品“博道久航”,2023年7月份完成策略改造并上线,也是定位于“基金指数增强”,但是追求超额收益最大化弹性,承担更大的跟踪误差。

首先,仿照FOF投资的思路,将所有主动选股的权益基金分成6大风格,即大盘成长、大盘价值、小盘成长、小盘价值、均衡型和轮动型。在此基础上,筛选出各个风格下的优秀主动权益基金,并通过量化选股思路复刻该风格经典的选股策略,同时吸收优秀主动基金经理的思路进一步迭代策略,使得子策略具有不输同策略主动权益基金的竞争优势后,根据885001成分基金的风格标签占比进行一定的调整,使得组合兼具稳定性和超额收益获取能力。最后,将六大选股策略都配置同一个产品上,即类FOF投资,风格间仿照偏股混基金指数风格分布配平。2023年7月起,博道久航正式运行该策略,截至到目前,表现是非常符合预期的。

2.2宽基和赛道指数增强系列

我们的产品线涵盖了从沪深300、中证500到中证1000的标准宽基指数增强产品,并且我们也提供了不受成分股约束、全市场选股的沪深300增强产品(博道叁佰智航)和中证500增强产品(博道伍佰智航)。

此外,还有三只具有特色的策略,我们将其定位为赛道指数增强系列。中信证券有一个风格系列指数,把市场上所有的行业分成了五种风格:消费、成长、周期、稳定、金融,我们挑选了两个长期有投资价值的赛道:消费和成长,对这两类风格指数进行量化增强,对应的产品分别是博道消费智航、博道成长智航。另外三个风格指数所覆盖的行业里,我们认为更具投资价值的是高股息个股,因此布局了博道红利智航。

从行业分布的角度来看,红利策略基本上与消费和成长策略构成了一个非常完备的投资空间。对于追求绝对回报的投资者来说,在进行简单的风险平价策略时,通常会使用宽基指数,比如将沪深300、中证500、中证1000指数组合起来。但如果采用经过优选的赛道指数,即优化过的贝塔,通常会取得更好的效果。无论是从追求绝对回报还是相对回报的角度来看,这套产品体系布局的核心理念是希望尽量提供经过优选的贝塔,并在此基础上为投资者提供阿尔法,也是我们提出的“好指数,用心+”的初衷。

三、核心理念

我们量化多因子模型的运作体系分为三大模块,分别解决不同的问题:

第一大模块是研究模块,它涉及如何评估多因子模型中的各个因子,如何将这些因子合成,以及如何形成对整体收益率的预测。

第二个模块是投资模块,它要处理的是,在获得研究预测后,如何根据不同产品对标的基准和风险约束,构建最终的投资组合。

第三个模块是日常事务性模块,负责归因分析、日常交易和拆单等操作。在这三个模块中,最重要的无疑是第一个研究模块。

图4:博道指数+产品运作体系

Image

资料来源:博道基金

四、研究与投资框架

到目前为止,在多因子模型方面,我们采用了两套框架,它们在实盘中各占约50%的权重。

4.1传统框架

第一套框架是传统多因子模型,这是在公募基金中被广泛使用的模型,也是我们自己实盘使用时间最长的一套模型。在过去几年中,我对这套模型又有了更深入的理解。

首先,在因子层面,其实经历了一个从简单到复杂,再从复杂回归简单的心路历程。由简单到复杂实际上是因子库数量扩充的过程,而由复杂到简单,则是经过这几年的深入思考后,对因子有了更本质的理解。从投资的底层逻辑出发,价格(P)始终等于每股收益(EPS)乘以市盈率(PE),无论什么因子,最终都是为了预测价格,要么具有很强的预测EPS趋势的能力,要么具有很强的预测估值波动的能力。基于这样的理念,我们对因子库进行了一级分类,所有因子首先会被贴上一个一级标签,标明它们是用来预测基本面趋势还是估值波动,我们要求每个因子都有非常清晰和纯粹的逻辑。这种分类不仅意味着因子是偏向于动量还是反转,而且对最终的配置方式有着重要影响。

图5:博道指数+传统框架多因子模型

Image

资料来源:博道基金

第一大类,基本面因子。在我的理解中,用来表征基本面趋势的因子具有多种维度,包括成长性、盈利质量、预期等。基本面因子的预测周期大约是1-3个季度,因为上市公司的基本面信息获取大多是以季度为单位的。基本面因子之所以能够盈利,核心原因在于上市公司的业绩经营具有一定的延续性。经济周期并不是每个季度都在变化,而是有一定的持续性。因此通过一个简单的策略,即挑选上个季度表现景气的公司,这些公司在下个季度平均来看,有大约60%的概率仍然处于高景气区间,这就是基本面因子能够盈利的核心逻辑。

概率的存在使得我们可以通过使用一些相对简单的基本面因子,如SUE等来赚取一定的超额收益,但由于这些因子的透明度较高,它们的波动性也相对较大,对于专注于基本面研究的研究员来说,如何在此基础上实现更持续稳健的超额收益是一个挑战。

在基本面因子的预测周期内,即1-3个季度,对基本面因子的挖掘需要非常注重基本面投资逻辑,要有对基本面的深入理解,通过对季度的三大财报深入挖掘各种勾稽关系,以提高在下一个季度保持高景气的转移概率,我们的目标是将那些自然转移的概率从60%提高到70%,甚至更高,通过不断升级和迭代因子,把胜率不断地逼近“上帝视角”。

什么叫逼近上帝视角?我们经常做这么一个测试:假设知道下个季度净利润的真实值,用它去提前计算类似于净利润增速、ROE或SUE,将能获得什么样的超额收益?这就是上帝视角的极限逼近。

第二大类,所有用于预测估值波动的因子在我的体系中被归类为反转类。因此,估值因子并不是基本面因子,而是表达反转逻辑的因子,即表达均值回归的反转因子。

这类因子根据预测周期的不同又分为两类,如果预测周期较短,例如1-20天,那么量价因子能够较好地表达这一范畴。在这种预测周期下,基本面并未发生显著变化,因此我们会更关注图形和统计规律的挖掘,赚取的是统计规律的钱。在我目前的认知中,人脑无法像机器那样极致、充分且客观地挖掘统计规律,因此,我们自2020年起已将这部分工作全部交给AI,在实盘中使用AI技术来挖掘量价因子。

另一个表达均值回归逻辑的因子是低估值因子,主要用于捕捉市场的无效定价。这种因子在基本面相对稳定的情况下,依赖于一套稳固的定价机制,然而,在某些阶段,由于特定因素,股价可能会偏离,我们认为股价最终会回归到这一定价体系,从而实现盈利。低估值因子的兑现概率通常在1到6个月之间,这个时间跨度相对较宽,难以预测,市场兑现概率的时间长度决定了因子有效性的展现。为什么在2019至2021年间,人们普遍感觉低估值因子失效?因为在那个时期,增量资金非常强劲,市场偏好动量成长股,导致低估值因子的兑现概率可能超过了六个月。尽管股价最终仍会回归,但其效率大大降低,表现为因子收益的稀释和所谓的失效。低估值类因子被用在1至6个月的估值波动预测周期,由于这一过程也涉及到基本面数据,我们现在对估值因子进行差异化的挖掘时,甚至会细化到对每个行业的定价因素进行比较分析,以便进行更深入的拆解。

为什么讲多因子呢?因为传统框架下的多因子模型主要涉及三个方面。

  • 首先,是定性的理解,包括因子库的理解、定义、挖掘和考核。
  • 其次是因子配置,即选择因子配置的方式,类似于主动基金经理的风格选择,可以是价值型、成长型、均衡型或轮动型。基于对因子两级分类的理解,目前我们选择的因子配置方式是一级等权、内部轮动。这种配置方式确保在任何时间点,基本面大类因子和均值回归大类因子的比例始终是各一半,这也是基于个人理念的选择。我们认为,在体系中,尽管风格会有轮动,但在任何时间点,无论是左侧的每股预期收益(EPS)还是右侧的市盈率(PE),都同等重要。最后,内部轮动是通过最大化信息系数(max IC)的配置模块来实现的,这是传统框架下的多因子模型。
  • 第三点是风控参数的选择,即在多大风险暴露下实现超额收益。

之所以强调因子的重要性,是因为传统多因子模型的核心竞争力就在于底层大类因子的有效性和持续迭代。尽管框架分类上,各家机构可能在类别上有所增减,但大同小异,真正的差异在于如何产生超额收益。我们内部要求自己,实盘的因子在三到五年的长期维度上,必须实现比同业平均水平更高的超额收益,这样累积下来的优势才能构成护城河。因此,在传统框架下,我们内部的考核和跟踪重点就在于底层大类因子的有效性。

我们内部有一个“零版本”的概念,所谓的“零版本”因子,是那些直接从卖方报告中归集而来的因子。只要在卖方报告中找到的定义,并且这些定义符合所关注的因子类型,那么这些因子就被称为“零版本”因子。

这里是我们内部的跟踪系统,它展示了从成长因子(图6)到算法量价因子(图7),再到分析师因子(图8),以及估值类低估值因子(图9)的超额收益。这些超额收益是在对中证500指数进行组合优化、扣除费用后的多头超额收益。这是一个完全可实现的收益,意味着如果仅依赖于单类因子,最终的超额收益就是这样的表现。

Image

对我们而言,我们要求的是负责特定领域的人员在经过挖掘后,合成的因子必须比“零版本”因子表现出持续且稳健的增量,才能被认为是合格的挖掘,也是比较严格的考核。同时我们也在跟踪和更新“零版本”因子,因为它们每年都会进行调整和迭代。我认为,大类因子有效性的提升是传统框架下多因子模型最核心的竞争力。

4.2AI全流程框架

刚才提到的传统框架多因子模型是我们实盘体系中的一部分,现在要介绍的是另外50%,我们称之为AI全流程框架下的多因子模型

图中最左边的部分展示了真实世界的所有基础信息,这些信息是人类大脑挖掘因子所能获得的数据,包括行情数据以及上市公司三大财报、公司公告、分析师报告和预测等信息,还包括一些另类数据,比如股票相关性分析、上下游产业链相关数据等,这些合在一起构成了AI全流程框架的基础信息,如下图所示,其中左侧的三个点合起来,实际上构成了特征工程的部分。特征工程在策略中可能占据了40%到50%的重要性。

图10:博道指数+AI框架多因子模型

Image

资料来源:博道基金

特征工程的构建和处理是至关重要的,在策略中可能占据了40%到50%的重要性。虽然我已经列出了这些信息,但这并不意味着可以直接将这些信息输入给模型,还需要经过大量的处理。

第二个部分是模型部分。模型部分的差异点是在于如何处理那些稀疏的、非规则化的数据,以便AI算法能够更好地识别和应用它们。这个部分要求找到适合处理每种数据特征的对应算法,以便更有效地提取信息。

我们最初开始是将AI量价分析的框架整合成一个完整的系统,但第一版的结果令人沮丧,因为尽管提供了更多的信息,最终的结果甚至不如仅使用量价信息。后来,我们花费了大量时间对框架的细节进行各种调整,模型也在不断进步和完善,目前我们这套框架的效果不仅超越了仅使用量价信息的版本,还能超越量价与其他因子结合的传统版本。到去年10月底,这个系统已经占据了我们实盘交易权重的50%。而从我们的第一个版本到去年10月底,中间已经推出了大约六个版本,所以说还是在以非常快的速度进行升级和迭代。

我需要特别强调的是,我们人为选择将权重分配为各一半的原因是基于对传统多因子模型和AI框架多因子模型的理解,我认为,这两种模型的本质是相通的。

传统框架下的多因子模型,其基础是经典的Fama-French三因子模型。在这种模型中,你可以添加更多因子来解释市场行为,但最终都可以简化为一个多项式回归模型。这个模型的目标是预测股价收益率,即Y值,你通过人工挖掘出许多强有力的因子,即X值,试图建立一个多元线性回归模型,以此来提高对股价的预测能力。在这种模型下,模型的结构相对固定和简单,可能只是一个多项式回归,或者稍复杂一些,但本质是相同的。这种简单模型的信息提取能力有限,但它的好处在于非常清晰且可控。因此,在这种模型下需要有非常强大的X值即因子,这些因子本身就对Y值有一定的解释力度,从而才能达到预期的预测效果。这就是传统框架下多因子模型的原理。

图11:为什么我们没有放弃所谓的“传统框架”?

Image

资料来源:博道基金

AI框架下的多因子模型,本质上与经典模型是一致的,都是为了预测收益率。不过,AI模型采用的是一个更为复杂和庞大的函数(FX),这个函数包含了大量的参数需要求解。在这个模式下,由于模型的复杂性和解析能力强,它不需要特别复杂的因子(X),相对简单的因子就足以支持模型。这意味着,只要设置得当,AI模型可以直接处理真实世界的所有基础信息,代替人脑提取大量结构化信息,这就是AI全流程框架的运作机理。

这里有一个简单的数据示例:三条曲线展示了不同的投资策略。最下面的绿色曲线代表了AI框架,它是在传统框架下通过偏线性的方式将因子组合起来,对中证500指数进行投资后的累计超额收益曲线。然后去年3月到8月期间对AI全流程框架进行了升级,最终使用的版本是橙色曲线。这条橙色曲线确实在AI全流程框架下表现出了比传统框架更明显的优势,呈现出震荡向上的趋势,战胜了传统框架。

图12:AI框架多因子模型

Image

资料来源:博道基金

当然,这并不意味着AI全流程框架能够压倒性地战胜传统框架。在这两种模式中,一个是依赖强大的因子(强X)来弥补模型的简单性,另一个则是依赖强大的模型(强model)来处理相对简单的因子(弱X)。

我们发现实践中这两套体系是可以互相促进的,在AI体系下得到的改进和迭代思路,反过来可以帮助促进传统体系下的因子升级迭代。比如我们原本是为了使算法更好地理解数据而对其进行了某些处理,后来我们意识到这些思路同样可以应用于传统框架中挖掘相关因子,并且确实带来了改进,经过迭代,它变成了蓝色这条曲线,即升级后的传统框架下的多因子模型。该模型的绩效基本与现在AI全流程框架下的绩效持平。

这回到了我们之前提到的,它并没有压倒性地战胜传统框架,而是可以相互促进,同时各自在适合的环境中发挥作用。传统框架的优势在于其清晰明了,并且可以严格控制基本面和均值回归。AI框架虽然可以通过一些设置尝试控制,但无法真正控制,它可能会给出相对随机的结果。因此,两者各自展现出互补的差异性。这也是我们最终选择将两者各占一半,并以相同的研究权重每天推进升级迭代的核心原因。

风险提示:本文基于演讲嘉宾在国信证券2024年度策略会金融工程分论坛公开发言进行整理,发言内容仅代表其个人观点,不构成对任何人的投资建议。


版权声明:文章版权归原作者所有,部分文章由作者授权本平台发布,若有其他不妥之处的可与小编联系。

免责声明:
您在阅读本内容或附件时,即表明您已事先接受以下“免责声明”之所载条款:
1、本文内容源于作者对于所获取数据的研究分析,本网站对这些信息的准确性和完整性不作任何保证,对由于该等问题产生的一切责任,本网站概不承担;阅读与私募基金相关内容前,请确认您符合私募基金合格投资者条件。
2、文件中所提供的信息尽可能保证可靠、准确和完整,但并不保证报告所述信息的准确性和完整性;亦不能作为投资决策的依据,不能作为道义的、责任的和法律的依据或者凭证。
3、对于本文以及文件中所提供信息所导致的任何直接的或者间接的投资盈亏后果不承担任何责任;本文以及文件发送对象仅限持有相关产品的客户使用,未经授权,请勿对该材料复制或传播。侵删!
4、所有阅读并从本文相关链接中下载文件的行为,均视为当事人无异议接受上述免责条款,并主动放弃所有与本文和文件中所有相关人员的一切追诉权。

0
好投汇
第一时间获取行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「好投汇」,或用手机扫描左方二维码,即可获得好投汇每日精华内容推送和最优搜索体验,并参与编辑活动。

推荐阅读

0
0

评论

你来谈谈?
发表

联系我们

邮箱 :help@haotouxt.com
电话 :0592-5588692
地址 :福建省厦门市湖里区航空商务广场7号楼10F
好投汇微信订阅号
扫一扫
关注好投汇微信订阅号
Copyright © 2017-2025, All Rights Reserved 闽ICP备19018471号-6