作者:因子动物园
题图:因子动物园微信公众号
这是文本分析与基金研究系列的第二篇文章。
这两天量化基金被推上了风口浪尖。业界关于量化基金的特征已有很多讨论,但我们很少见到学术界对量化基金的理解。本文旨在对此进行简要的梳理介绍。
需要说明的是,虽然说到量化基金,往往以对冲基金/私募基金为主,但由于这些基金的信息往往并不公开,难以有效获取相关数据,因此,在研究中,主要还是以公募基金为主。
1. 量化与主观基金的“定性”差别
首先,从定性的角度对量化与主观基金进行区分。简单来说,量化基金依据一定的规则生成交易信号、进行交易;而主观基金则主要依赖研究员和基金经理的分析和判断,虽然在分析和投资决策中,他们往往也会采用一定的规则,但这些规则往往不是固定的。因此,量化与主观基金的区别体现在分析能力(Capacity)和灵活性(Flexibility)上的显著差异。
具体来看,利用大数据和强大的算力,量化基金可以对大量证券(典型如全市场的股票)进行统一的分析,主观基金则显然做不到这一点。与此同时,主观基金可以灵活地调整仓位,在不看好大势时大幅减仓、对市场和风格进行择时,但量化基金通常维持很高的仓位甚至满仓,并按照固定的规则交易,因而缺乏弹性。
上述定性的差异虽然直观,但我们要如何用数据来检验这些差异,并得到更多的 insights 呢?一个关键便是利用恰当的方法将基金准确地划分为主观基金和量化基金。这就要求开发一个基金分类算法。
2. 基于文本分析和机器学习的基金分类
基金会在其募集说明书的主要投资策略(Principal Investment Strategies, PIS)章节对其投资策略进行说明。Abis and Lines (2020) 表明,美国市场中大多数基金总体来看是按照其策略描述进行投资的(参见【104】文本分析与基金研究(I):基于文本的基金分类)。因此,一个直观的想法是与那篇文章相似,通过对基金 PIS 的文本分析,来判定基金是主观基金还是量化基金。
Abis (2022) 正是这样做的。特别地,Abis (2022) 通过结合文本分析与机器学习算法来对基金分类,具体方法如下:
首先,从全部样本中随机抽取 500 个观测,这些随机抽取的观测大致能匹配原始数据中的基金-月份(fund-month)分布。作者接下来通过人工标注的方式来为这 500 个观测贴标签(主观基金或量化基金)。
从其任职的哥伦比亚大学选择了 12 名金融学专业的同学,这些同学参与了多种金融学相关的硕士项目,对投资和基金有较为专业的理解。作者让这些同学分别判断这 500 只基金属于主观基金还是量化基金,进而依据同学们的判断来为基金分类。特别地,作者排除了分类明显异于其他人的两位同学,进而根据其他 10 位分类较为一致的同学的意见确定这 500 只基金的类型:若有至少 8 位同学认为一只基金是量化(主观)基金,则认为该基金是量化(主观)基金。结果表明,其中,69 只基金为量化基金,386 只基金为主观基金。
接下来,作者从 500 只基金中随机选取了 104(1.5 * 69)只基金、用于后续检验训练的模型,而用其余观测作为训练集,来训练一个随机森林(Random Forest)模型,以对全部观测进行分类。特别地,该随机森林模型的输入为利用词袋法(bag-of-words)从全部基金 PIS 文本中生成的特征,其中,每一个基金 PIS 文本被表示为一个包含全部特征的向量,若该 PIS 文本提到了相关特征,则对应元素为 1,反之则为 0。
利用这一随机森林模型,作者在前述随机选取的 104 个观测构成的测试集中得到了 97.67% 的准确率,表明这一分类模型是非常有效的。事实上,这一模型也非常符合直觉。图 1 展示了该模型中重要性排名前 15 的特征,其中,Panel A 按照信息含量(用按照该特征分组时熵的减少来度量)排序、而 Panel B 中则按照 SHAP value 均值排序。两种方法的结果非常相似,量化(quantit)、模型(model)、使用量化方法(use quantit)、动量(momentum)和基准(benchmark)等词汇(的词根)排名靠前,这些词组也的确是量化策略主要采用的说法。
图 1:随机森林分类模型中的特征重要性. 数据来源:Abis (2022).
3. 量化与主观基金的基本特征
虽然业界和学术界对量化基金缺乏统一的定义,但根据已有的研究和业界报告来看,量化基金往往采用因子投资的理念指导投资决策,利用因子模型和异象特征来发现潜在的错误定价和投资机会。这使得主流因子模型对量化基金业绩的解释能力应更强。值得注意的是,高频交易型基金使用的高频因子往往不在经典学术研究的研究范围内,因而采用学术研究提出的基于月数据的中低频因子模型对其收益的解释能力可能不会很好。但如前所述,Abis (2022) 主要考察的是公募基金,其主要采取的是中低频因子,因此,这一论点应当成立。
此外,根据第 1 小节的定性分析,主观基金胜在灵活,这种灵活性的最大好处是主观基金可能可以更灵活、有效地应对危机。因此,总体来看,相比量化基金,主观基金在衰退期间的业绩应更好,尤其是在风险控制方面。换言之,其他因素相同的情况下,在衰退期间,量化基金的波动率可能显著更高。
表 1 报告了相关结果。前两列比较了 Fama-French 五因子+动量的六因子模型对量化基金和主观基金业绩的解释力。结果显示,量化基金的调整后 R 方显著更高(高出 5%),表明因子模型对量化基金业绩的解释力的确显著更强。后两列则比较了不同基金相对于前述 FF 六因子模型的异质波动率(即残差的标准差),其中,交互项 显著为正,表明量化基金在衰退期间的波动率的确显著更高。
表 1:量化与主观基金的对比. 数据来源:Abis (2022).
4. 量化与主观基金的投资差异
当然,我们不仅仅关心这些基本的典型事实。更重要也更有趣的问题是,量化基金和主观基金在投资组合选择、投资能力和业绩上,到底有什么样的区别?
为回答这些问题,Abis (2022) 借鉴 Kacperczyk, van Nieuwerburgh and Veldkamp (2016)(后续简称为 KVV (2016))这篇发表于经济学顶刊 Econometrica 的经典文章的框架来从理论上分析量化与主观基金的差异、进而提出相应的研究假设。特别地,KVV (2016) 从一个有着有限注意力的基金经理的注意力分配问题出发,考察了基金经理的注意力分配如何随市场状态/经济周期而变化。KVV (2016) 的分析表明,理性的基金经理会在衰退时期聚焦于利用宏观信息进行择时,而在经济扩张时期则聚焦于股票的个体信息(即选股),从而呈现出动态的选股-择时能力。
显然,KVV (2016) 的这一分析对主观基金这一类历史悠久的基金是成立的。对于量化基金则不然。依托于大数据和强大的算力,量化基金可以对不同股票进行较为深入的分析,这也符合量化基金利用因子投资方法和异象特征选股的定位。换言之,对于量化基金而言,有限注意力这一问题不再成立,这意味着量化基金往往有更好的选股能力、使得它们可以更好地捕捉到错误定价带来的投资机会。但量化基金也有劣势,那就是其策略及分析方法天然决定了量化基金不太容易利用宏观信息来择时。
据此,Abis (2022) 提出了其第一个研究假说:
有能力的主观基金可以对衰退做出灵活的反应,使得其有比量化基金更好的择时能力;反之,量化基金有更强的选股能力。
Abis (2022) 将上述能力前 q%(其中,q 取值为 10 至 25)的基金划分为高能力组,并相应定义虚拟变量 TopPickers (TopTimers),选股(择时)能力强的基金取 1,反之取 0。在此基础上,通过以下回归检验前述假说:
表 2 给出了结果的可视化呈现。前 3 列表明,量化基金在择时方面表现不佳,尤其是那些选股能力优异的量化基金更是如此。第 4 列(Picking(R))则表明,量化基金在选股能力上的确更强。
表 2:量化与主观基金的选股与择时能力差异. 数据来源:Abis (2022).
量化与主观基金在持仓分散度上也应有显著的差别。由于量化基金可以同时对大量股票进行分析(当然,实践中还有量化基金往往对风险、尤其是回撤的容忍度更小的因素),量化基金往往持有一个高度分散的投资组合(例如,最近大火的国金量化多因子的中报显示其持有超过 1700 只股票)。
Abis (2022) 也验证了这一点。其分析表明,平均而言,量化基金比主观基金持股数量多 36%,波动率也显著更低。与此同时,值得注意的是,这些差异在衰退期间显著缩小。
除去上述非常直观的推论,量化和主观基金在投资选择上还有着更多非常明显的差异。回顾前面的理论分析,量化基金可以利用可得信息,对大量股票进行无差别的深入分析。因此,自然地,那些有更多可得信息的股票会受到量化基金的更多关注。
为实证检验这一假说,需要股票可得信息量的代理变量。Abis (2022) 构建了 4 个代理变量,包括:
- 股票(对数)市值;
- 年龄(月份数);
- 媒体关注度(当月华尔街日报涉及该股票的新闻数量的对数);
此外,Abis (2022) 还考虑了跟踪一只股票的分析师数量。由于分析师报告会综合很多相关信息,跟踪股票的分析师越多,则量化基金在该股票上相对于主观基金的信息优势越小,相应地,其他因素相同的情况下,量化基金会更少地投资该股票。
通过按照基金持仓权重将相关股票的指标加总到基金,便得到了基金组合的信息量指标。
表 3 报告了相关结果。结果验证了上述假说:平均来看,量化基金投资组合包含的股票有更大的市值、年龄和媒体关注度,表明这些股票的确有更多的可得信息。此外,量化基金投资的股票被更少的分析师覆盖,同样佐证了量化基金更偏好他们有信息优势的股票。
表 3:量化与主观基金持仓的信息量差异. 数据来源:Abis (2022).
另一个有趣而重要的差异也沿袭自 KVV (2016)。主观基金的基金经理对于不同股票有不同精度的私有信号,通常对少数股票有高精度的信号而对大多数股票则没有,这使得他们的投资组合(权重)呈现出很大的截面差异。不仅如此,不同的主观基金往往着重关注不同的股票,这意味着他们有高精度私有信息的股票也不同。上述因素意味着主观基金的投资组合之间可能有更大的差异。反之,对于量化基金则不然。理论上,量化基金可以无差别地对每只股票获取同等精度的私有信号,因此,其投资组合总体上更加相似。
基于以下投资组合离散度的测度,Abis (2022) 实证检验了上述假说:
最后,量化基金更为分散、相似的持仓和对选股能力的侧重,还对两类基金的主动收益(也即基金研究中所说的 alpha)有着明确的预测:量化基金的主动收益会更为相似;而主观基金有更好的择时能力,使得在衰退时期,量化基金的主动收益比主观基金更低。
5. 结语
Abis (2022) 利用文本分析和机器学习方法将公募基金分为量化基金和主观基金两大类,进而比较了二者在能力、投资组合分散度和离散度,以及偏好的股票类型上的差异。这些典型事实虽然可能我们或多或少都已知道,但这是学术研究中第一次有人仔细地对此进行刻画和检验,从而使得量化基金正式进入了学术研究的视野。
此外,值得注意的是,这篇文章的早期版本中其实写了一个完善的理论模型,虽然这一模型是基于 KVV (2016) 进行的扩展。而在文章在 JF R&R 并最终被拒稿后,作者在最新版本中删除了理论模型、而代之以一个简要的理论框架(theoretical framework),并将重点放在了实证分析上。【060】盈利与投资因子:历史分野与模式转变 介绍过的文章也经历了类似的处理:作者在最终发表于 JFE 的版本中将其理论模型完全删除掉了,改为从 investment CAPM 的角度做了一个纯实证研究。
全文完。祝您阅读愉快!
免责声明:本文在任何情况下都不代表投资建议。文中图表均来自相关文章、期刊,或互联网数据,版权归原作者和期刊所有,也不代表本公众号的意见。
References:
- Abis, Simona. "Man vs. machine: Quantitative and discretionary equity management." SSRN Working Paper (2022).
- Kacperczyk, Marcin, Stijn Van Nieuwerburgh, and Laura Veldkamp. "A rational theory of mutual funds' attention allocation." Econometrica 84.2 (2016): 571-626.
版权声明:文章版权归原作者所有,部分文章由作者授权本平台发布,若有其他不妥之处的可与小编联系。