PCA 的源起、中兴和未来-好投汇-带你学财富管理

作者：川总写量化

题图：川总写量化微信公众号

摘要

PCA 及其各种变化已成为估计隐性因子模型的利器。本文带你了解实证资产定价领域中 PCA 的源起，中兴和未来。

1 源起

APT (Ross 1976) 指出资产收益率和因子之间的线性结构。根据定义，我们可以把资产协方差矩阵用因子暴露和因子溢价的协方差矩阵表示，即：

然而在实证方面，应用 PCA 却并没有那么顺利。Connor and Korajczyk (1988) 最早使用大约 1500 支股票研究了隐性因子模型的表现。结果显示，尽管基于 PCA 的因子模型比起 CAPM 模型更能解释样本中的风险和收益率，但定价误差依然非常显著。这是因为基于 PCA 估计的时无条件（或静态）因子模型（即 beta 不随时间变化），而这类模型很难描述个股级别的数据。从那之后，PCA 便淡出了人们的视线。

2 中兴

近年来，随着机器学习在实证资产定价中的广泛应用，PCA 再次回到了人们的视线。这一现象在一定程度上得益于三方面的原因。

首先最重要的原因是，尽管基于个股协方差矩阵的 PCA 所构造的隐性因子模型在描述个股面板数据时效果不理想，但如果把 assets 换成基于公司特征构造的投资组合，然后使用投资组合的协方差矩阵作为 PCA 的输入，则得到的隐性多因子模型能够很好的为这些资产定价。这方面的代表包括 Kozak, Nagel and Santosh (2018, 2020)。

第二个原因是从无条件（静态）因子模型向条件（动态）因子模型的转变，这背后的代表是 Kelly et al. (2019) 的工具变量 PCA（IPCA）模型。该模型和前述研究最大的区别是将因子暴露 beta 视为公司特征的函数，从而对 beta 直接建模。由于公司特征是随时间变化的，因此 beta 也自然就是时变的。以此得到的隐性因子模型能够更好的捕捉资产收益率在时序的变化以及在截面上的差异。后续一些比较基于不同机器学习方法所构造的因子模型的实证研究发现，IPCA 方法不输于（甚至是优于）一些更复杂的非线性模型（例如深度神经网络）。

来进行。不难看出，传统 PCA 方法只考虑了收益率的二阶矩信息，而忽视了和定价可能更为相关的一阶矩信息。基于这个动机，Lettau and Pelger (2020a, b) 对协方差矩阵进行了变形，加入了一阶矩信息：

3 未来

Lettau and Pelger (2020a, b) 的研究事实上为进一步发挥 PCA 在实证资产定价中的作用提供了一个可行的思路，即人们能否通过经济学指引对样本协方差矩阵进行其他变形，从而更好的估计隐性因子模型。Bryzgalova et al. (2023) 一文从时序和截面角度精彩地回答了这个问题。（BTW，去年我没在知乎上回答 202X 年优秀的金融学论文这个问题。如果要我来回答，那么它就是 Bryzgalova et al. 2023）。

这篇文章最大的价值，是提出了如何在样本协方差矩阵中纳入截面或时序或 both 信息的一个框架。在数学上，它们均可以被表达为在样本协方差矩阵中加入相关信息的形式，并通过罚参数来控制信息的强弱。以截面信息为例，我们可以对如下矩阵进行 PCA：

先来说截面方面。大量实证结果表明通过公司特征进行组合排序而构造的分位数投资组合的收益率往往十分单调。因此我们自然希望这些投资组合对于 PCA 得到的隐性因子的暴露也是单调的。我们可以以此为目标对样本协方差矩阵进行相应的变形。

从 Bryzgalova et al. (2023) 的实证结果来看，加入截面或者时序信息的 PCA 在样本内、外均能获得更好的结果，体现为更小的定价误差以及更高的夏普比率。那么，为什么加入这些信息有助于估计出更好的因子呢？

对于估计隐性因子而言，能否发现一个因子的关键因素在于因子的强度，即它能解释资产收益率共同运动的比例。这一点从 PCA 的结果不难理解：找到的因子对应着特征值最大的特征向量。然而，如果一个因子仅能解释很少的波动，它就是一个弱因子（week factor），哪怕它带有关于截面预期收益率差异的重要信息，也无法被 PCA 发现。在样本协方差矩阵中加入截面和/或时序信息的作用就是为了提高弱因子的强度。因此，尽管一个因子就解释资产波动而言可能很弱，但是它在新加入的信息方面可能很强。通过对协方差矩阵的变形能够提升这些因子的强度，从而让它们可以被发现和估计。

对于不同类型的因子，加入新信息都是有益的。那些原本无法仅通过协方差矩阵检测到的弱因子，现在可以被估计出来。那些强度一般的因子（semi-weak factors），能够以更高的收敛率被估计出来。而对于本来就能够解释大部分波动的强因子而言，加入上述信息也能提升它们的估计效率。这是因为加入的截面和时序信息包含了收益率的一阶矩信息，而如此得到的 PCA 可以被视为一个矩估计量，其中通过优化罚参数来权衡不同的矩信息。

Bryzgalova et al. (2023) 所提出的框架的意义在于，它能够让人们根据自己的目标，通过适当的经济学依据来引入关于隐性因子的先验信息，并得到更好的隐性因子模型。它代表了 PCA 的未来。

最后，让我以 Bryzgalova et al. (2023) 自己的话总结并结束本文：

Our framework can be used to study a broad class of various asset-pricing restrictions related to different spanning properties of the risk factors as well as shape restrictions on their loadings. Importantly, we do not aim to provide a single most efficient way to recover the underlying SDF by choosing “optimal” priors. Instead, we allow the researcher to specify different types of restrictions consistent with both structural and reduced-form insights about the cross-section of asset returns and risk factors that drive it.

参考文献

Bryzgalova, S., V. DeMiguel, S. Li, and M. Pelger (2023). Asset-pricing factors with economic targets. Working paper.

Chamberlain, G. and M. Rothschild (1983). Arbitrage, factor structure, and mean-variance analysis on large asset markets. Econometrica 51(5), 1281–1304.

Connor, G. and R. A. Korajczyk (1986). Performance measurement with the arbitrage pricing theory. Journal of Financial Economics 15(3), 373–394.

Connor, G. and R. A. Korajczyk (1988). Risk and return in an equilibrium APT application of a new test methodology. Journal of Financial Economics 21(2), 255–289.

Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return. Journal of Financial Economics 134(3), 501–524.

Kozak, S., S. Nagel, and S. Santosh (2018). Interpreting factor models. Journal of Finance 73(3), 1183–1223.

Kozak, S., S. Nagel, and S. Santosh (2020). Shrinking the cross-section. Journal of Financial Economics 135(2), 271–292.

Lettau, M. and M. Pelger (2020a). Estimating latent asset-pricing factors. Journal of Econometrics 218, 1–31.

Lettau, M. and M. Pelger (2020b). Factors that fit the time series and cross-section of stock returns. Review of Financial Studies 33(5), 2274–2325.

Roll, R. and S. A. Ross (1980). An empirical investigation of the arbitrage pricing theory. Journal of Finance 35(5), 1073–1103.

Ross, S. A. (1976). The arbitrage theory of capital asset pricing. Journal of Economic Theory 13(3), 341–360.

免责声明：
您在阅读本内容或附件时，即表明您已事先接受以下“免责声明”之所载条款：
1、本文内容源于作者对于所获取数据的研究分析，本网站对这些信息的准确性和完整性不作任何保证，对由于该等问题产生的一切责任，本网站概不承担；阅读与私募基金相关内容前，请确认您符合私募基金合格投资者条件。
2、文件中所提供的信息尽可能保证可靠、准确和完整，但并不保证报告所述信息的准确性和完整性；亦不能作为投资决策的依据，不能作为道义的、责任的和法律的依据或者凭证。
3、对于本文以及文件中所提供信息所导致的任何直接的或者间接的投资盈亏后果不承担任何责任；本文以及文件发送对象仅限持有相关产品的客户使用，未经授权，请勿对该材料复制或传播。侵删！
4、所有阅读并从本文相关链接中下载文件的行为，均视为当事人无异议接受上述免责条款，并主动放弃所有与本文和文件中所有相关人员的一切追诉权。

PCA 的源起、中兴和未来

川总写量化

推荐阅读

评论

友情链接

帮助中心

联系我们