「黎明之前」因果因子投资理论

SerendipityCamp
19604-18 10:11

作者:SerendipityCamp

题图:SerendipityCamp微信公众号


严密度分级

金融市场里,我们应该理解到的最重要的观点之一就是:并非所有主张的经验证据都同样有力,它们被伪造和传播的难度也存在差异。

比如,演绎法得来的结论通常采用因果推理的形式语言,通常具备更高的可信度(科学,是没有恒常逻辑的实践——漫谈归纳·演绎·溯因三大方法论),但仍能够通过统计学的方式进行伪造,或错误地应用统计理论得出错误的结论。而联想性或观察性的归纳法研究(比如专家意见),通常是基于现象学的,具备较低的严格性,也更容易被伪造或传播。

严密度是与推理方法严格相关的(见《统计信仰》新书首发!第一章),不同于低严密性的归纳法,在演绎逻辑中,我们通常会发现一些不同寻常的,无法启发式探寻得到的结论——那些看似违背了常识的非主流的共识——这当中就包括一些非常重要的有关投资的奥秘(「告别寻租」演绎逻辑重建投资第一性原理)。

由于推理方式的差异,关联严密度的差异——从这个命题出发,我们可以做出一张有趣的表格:

图片

先来看后三项:

观察研究的典型代表是计量经济学,传统认为,计量经济学在学术上很严格,但其投资表现却不佳。研究者声称采用数学模型,统计技术和数据分析来研究经济现象和验证经济理论,比如供需,消费者行为,生产决策,市场竞争等,然而,它过于倚重例举归纳法,可能会引入过拟合,多重共线性,选择偏差等问题,而最为普遍的两类问题则是:

  • 将随机噪声当做信号来处理(「信号&噪声」击碎概率校准的1/2魔咒)
  • 将相关性当作因果关系(「自然之殇」缺失实在性的因果之惑,「贝叶斯的诅咒」偏见的胜利与因果性的破灭)

这里的回测分析通常是一种基于历史数据的归纳方法,它依赖于历史数据中的模式和关系,并将其向未来线性外推,这会导致过度拟合(策略在历史数据表现优秀,只是因为过度适应历史数据的特定模式)、数据挖掘偏差(只要尝试足够多,总有一些策略会胜出,但并不意味着它们在未来更有效)等问题。

案例研究提出了解释一种现象的多个方面的理由(多因子归纳),但它通常是基于小样本的观察性研究,缺乏学术的严谨性,并存在案例的选择偏差——研究者很可能被吸引人的公司和故事吸引,比如一谈到价值投资就拿伯克希尔哈萨韦公司举例。许多案例研究都是基于已知结果的前提,这将带来后设定偏差,即研究者有意无意地选择符合已知结果的因素进行分析,这必然带来错误的归因,忽视了其它潜在的解释。

投资大师的自由裁量观点,通常依赖于经验法则和有根据的猜测(启发式)来得出结论。这种比归纳法还要弱的声音,让研报和投资大师的投资建议越来越被看作轶事和传闻。

这也是为什么经济学家越来越不吃香的原因——他们的决策都是启发式的,对于错误的预测,他们也很少认错。因此,经验丰富的大型资产管理公司通常不依赖投资大师来预测市场,而是引入演绎法思维,比如进行所谓的算法轮实验(Algo-wheel,在确定的约束下同时验证不同算法或策略的表现)来评估经纪人的能力。

如今的金融世界已经不是学会格雷厄姆和巴菲特“几条能用一辈子的原则”就能玩得转的时代了——对强证据的关注和追逐的趋势下,全球头部对冲基金大都在押注宏观、多策略乃至纯粹的量化,追随这一趋势,我们需要投入更多的精力到表格前三项的演绎推理的部分:

模拟干预与后三项有本质的不同——因为这里更重视数学抽象,采用了因果推理的形式语言来传达可被证伪的理论(「无尽的剃刀」“上周四主义”到波普尔争议)。因果图能够精确分辨相关性和因果关系之间的区别。

图片

所谓的干预,意味着我们正在处理的是Judea Pearl所说的第二层"高级认知",如果没有干预,我们就只停留在第一层上——被动观察(「贝叶斯的诅咒」偏见的胜利与因果性的破灭)。干预算子的引入,在因果图上的意义,是清除所有指向自己的箭头——这样就可以阻止信息在非因果路径的方向上随意传播。这意味着找到真正的因果路径。

接下来是自然实验。我们说,它优于模拟干预,因为这里涉及到了实际的操作。自然实验依赖于外部事件或政策变化作为“实验的干预”,这些事件或政策变化对被研究的对象产生了随机或近似随机的影响,从而允许研究者通过观察这些影响来分析其因果关系。

比如利用差异对比的方法(Difference-in-Differences, DiD),分析实验组和对照组在政策实施前后股票价格的变化差异。这种方法可以帮助隔离政策效应,减少其他未观察因素的干扰。在分析中,还可以引入统计学假设检验的方法,进一步量化结论的可靠性。

最高的严密度则留给了随机化受控实验,即全面的实验设计DoE思想,这提供了最高的透明度和复现性——实验设计是因果科学的研究之梯(「梦想的细节」从汽车能源转型窥探人类工业进步史)。

图片

需要重申的是,金融领域里进行严格的受控实验并非易事。

而且,因为选择实验通常在取得数据之前被决定——从频率学派的立场上来看,这种提前决定实验设计的方法,自然就引入了主观性(比如,这里可以作弊——通过停止规则操纵,显著性挖掘,选择性汇报等方式来干预结果)。哪怕我们处理得再仔细,这里的推断的因果形式仍无法完全摆脱潜在因果机制的线形外推(一种归纳式的总结)。

相比之下,贝叶斯分析(「统计信仰」金融世界的贝叶斯之旅)则没有这种困扰——它们更少地受到实验设计的影响。

因果推理黎明之前

FF93《Common risk factors in the returns on stocks and bonds》和FF15《A Five-Factor Asset Pricing Model》是金融学界非常重要的研究成果。

FF93论文是在1993年由Eugene Fama和Kenneth French合作发表的,这篇论文提出了一个三因子模型来解释股票和债券收益的变化。

这三个因素包括市场风险因子(即市场组合的超额收益),规模因子(即小公司股票与大公司股票的收益差异)和价值因子(即高账面市值比率股票与低账面市值比率股票的收益差异)。这个模型在金融领域产生了深远的影响,被广泛应用于资产定价和投资组合管理中。

FF15论文则是在2015年发表的,Fama和French在这篇论文中扩展了他们的三因子模型,增加了两个新的因子:盈利能力因子(即高盈利公司股票与低盈利公司股票的收益差异)和投资因子(即低投资公司股票与高投资公司股票的收益差异)。这个五因子模型进一步提高了模型资产收益变化的解释能力,也为投资者提供了更加全面的风险评估工具。

这两篇论文都对现代金融理论和实务有着重要的贡献,至今已经衍生出了数千篇研究论文,使其已经成为金融学研究的经典文献。然而不幸的是,依照我们全新的严密度分类视角来打分,这两篇论文都将被判不合格:

首先,两位作者在选择模型之前,进行了多种尝试并选择性汇报——即著名的P-hacking,从而能够获得统计学上显著的结果。

其次,作者用解释力而不是因果图来进行证明,这显然不够严密。

第三,作者忽略了已知的宏观经济混杂因素,如通货膨胀、GDP、商业周期阶段、收益率曲线的陡峭度等因子。尤其奇怪的是,FF93第2.1.2节明确提到了商业周期对规模的混杂效应,但该混杂因素在模型中莫名其妙地消失了。

第四,有据可查的是,动量和价值因素之间存在相互作用(Barroso和Santa-Clara在2015年的研究)。这种相互作用可以用动量和价值之间的混杂关系来解释,使动量成为另一个可能缺少的混杂变量。

第五,作者没有指出带来报告观察结果的因果机制,并否认了其模型的因果性的内容。

有意思的是,1997年,Carhart通过增加动量作为第四个因子,拓展了FF93的三因子模型,这种扩展的理由是C97四因子模型能够获得更高的解释力——这是这是FF15用来添加两个因子的相同的理由。

然而,C97忽视了所控制的动量因子与混杂因子的价值高度相关。更重要的是,C97与FF15的共存就产生了新的矛盾。

如果我们进一步假设:

(1)公司的股票回报率和规模是独立变量;

(2)这两个变量都影响公司的账面市值比(账面市值比是一个财务指标,用于评估公司的市场价值与其账面价值的比较,显然,这是一个对撞因子)。

在这种情况下,对账面市值比的约束在(1)中的两个独立变量之间引入了负的非因果关联。换句话说,通过在其模型规范中添加账面市值比,FF93、FF15和C97可能无意中诱发了股票回报和规模之间的非因果的负相关性,使规模因子被错误地认定为关键因子。

而另一个副作用则是,学术界和市场参与者频繁采用FF93、FF15和C97的因子模型,用来构建暴露于特定风险特征的投资组合——这就是价值型基金通常通过按照账面市值比而不是模型的其它因子对股票进行排序,来创建投资组合的底层原因。

曾有人给我留言说,研究西化的(数学)理论有什么用处?东西方哲学就能够解释一切。对此论调我想说的是:

当代投资者必须尊重科学的投资理论,尤其是要学习借助抽象化的数学工具进行高效的因果的关系的挖掘。这至少有三个原因:

首先,理论是对思维误区的威慑——理论迫使人们不断试图证明他们的选择是合理的,如果我们可以不断复现基本的因果链条,就可以降低我们需要不断解释市场随机变异的额外努力。

其次,因果关系是投资效率的必要条件——通过科学的演绎归因,投资者可以建立一个以投资效率为目标的投资组合。相比之下,归纳式相关性模型则常常错误地归因,并阻止了投资者建立高效投资组合的可能性。

第三,因果模型能够进行反事实推理,因此能够以连贯和前瞻性的方式对投资策略进行压力测试。相比之下,归纳式的相关性模型无法回答反事实问题。

假设有一个相关性模型,该模型只能分析股票市场中不同资产之间的历史相关性。例如,这个模型可以告诉我们在过去的十年里,股票A和股票B的相关系数为0.7,这意味着它们之间存在较强的正相关关系。

然而,这个相关性模型无法回答反事实问题,比如“如果美联储突然提高利率,股票A和股票B的表现会怎样?”这个问题需要对未来的经济情景进行预测,并考虑到可能的因果关系,而不仅仅是基于过去的相关性数据。

而那些过于依赖过去相关性数据,不深入探讨因果机制进行决策的人,其下场只会迎来黑天鹅。

在没有因果理论模型的情况下,没有人知道为什么价值基金就应该表现良好。回答“为什么”的问题需要一种可证伪的因果机制——而直到今天,这种机制对于价值投资仍然是未知的——显然,资管公司不会公开它们的这一困惑,否则将面临投资者的大量赎回。

忘却了因果机制,因子投资策略就陷入了关联性的迷雾,我们只能退而求其次,活在归纳法统治的世界里,研究人员可能会发现,价值和动量策略多年来一直有利可图(列举归纳法),这一相关性的发现产生了一种期望,即无论价值和趋势的未知原因是什么,也无论其盈利能力的机制是什么,历史都会继续重演,即使这种信念没有科学演绎基础。

只要资产管理人仍然无法回答“为什么”的问题,他们就应该避免向公众推销因子投资产品作为正式的金融产品——任何机构都应该在销售前,质疑因子某种投资产品是否是投资级。

每一年,新的市场数据集都以越来越快的速度出现,使研究人员和市场参与者能够随时进行自然实验和其他类型的因果推断,这些工作在二十世纪是不可能进行的。

可以预期,“因果因子投资”将越来越被大众熟知和掌握,它并不复杂和难以理解,它的雄心不单单依赖理论的加持——它致力于瞄准一个更加崇高的理想:促使资管经理以只有科学方法才能提供的透明度和信心来履行其职责。


版权声明:文章版权归原作者所有,部分文章由作者授权本平台发布,若有其他不妥之处的可与小编联系。

免责声明:
您在阅读本内容或附件时,即表明您已事先接受以下“免责声明”之所载条款:
1、本文内容源于作者对于所获取数据的研究分析,本网站对这些信息的准确性和完整性不作任何保证,对由于该等问题产生的一切责任,本网站概不承担;阅读与私募基金相关内容前,请确认您符合私募基金合格投资者条件。
2、文件中所提供的信息尽可能保证可靠、准确和完整,但并不保证报告所述信息的准确性和完整性;亦不能作为投资决策的依据,不能作为道义的、责任的和法律的依据或者凭证。
3、对于本文以及文件中所提供信息所导致的任何直接的或者间接的投资盈亏后果不承担任何责任;本文以及文件发送对象仅限持有相关产品的客户使用,未经授权,请勿对该材料复制或传播。侵删!
4、所有阅读并从本文相关链接中下载文件的行为,均视为当事人无异议接受上述免责条款,并主动放弃所有与本文和文件中所有相关人员的一切追诉权。

0
好投学堂
第一时间获取行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「好投学堂」,或用手机扫描左方二维码,即可获得好投学堂每日精华内容推送和最优搜索体验,并参与编辑活动。

推荐阅读

0
0

评论

你来谈谈?
发表

联系我们

邮箱 :help@haotouxt.com
电话 :0592-5588692
地址 :福建省厦门市湖里区航空商务广场7号楼10F
好投学堂微信订阅号
扫一扫
关注好投学堂微信订阅号
Copyright © 2017-2024, All Rights Reserved 闽ICP备19018471号-6