Portfolio Sort 的源起、中兴和未来-好投汇-带你学财富管理

作者：川总写量化

题图：川总写量化微信公众号

摘要

Portfolio Sort 是实证资产定价和因子投资中的常见方法。本文带你了解 Portfolio Sort 的源起，中兴和未来。

1 源起

资产定价的研究目标是解释不同资产的预期收益率在截面上的差异。为了构造因子、或者为了检验给定的定价模型，选择适当的资产（被称为 test assets）十分关键。在这方面，一个自然的想法是使用 individual assets，比如个股。但是个股层面巨大的 idiosyncratic noise 使得估计得到的 beta 误差很大，造成 errors-in-variables（EIV）等问题。

正因如此，在最早检验 CAPM 的时候，无论是 Black, Jensen, and Scholes (1972) 还是 Fama and MacBeth (1973) 都选择使用投资组合代替个股。具体而言，他们将个股按照其历史 beta 的大小排序，然后构成不同的投资组合，并检验这些投资组合的收益率和 beta 的关系。这背后隐含的逻辑是，个股 beta 的估计误差相互抵消，因此投资组合的 beta 估计值更准确。

这就是最早的 portfolio sort。

2 中兴

然而，真正让 portfolio sort 成为实证研究标配的是 Fama and French (1992, 1993)。Fama 和 French 利用 portfolio sort 分别研究了 size、value 等异象并提出了 Fama-French 三因子模型。颇为有意思的是，在研究异象的时候，股票被分为 10 组；然而在构造因子的时候，股票则是依照市值和 BM 分别被分为了两组和三组（下图展示了 SMB 和 HML 两个因子的构造方法）。

构造因子时的分组数通常小于研究异象时的分组数。这背后的逻辑并不难理解：为了控制市值的影响，构造因子往往使用目标变量和市值独立双重排序。如果每个变量下分的组太多，那么一些投资组合可能就没有足够数量的股票。

作为实证研究的典范，Fama 和 French 开创的传统被自然而然地延续了下来。后续的一众实证研究，在通过 portfolio sort 研究异象时，无不采用 10 组的划分；而当构造因子时，使用的组数则要少得多。John Cochrane 在 AFA 主席演讲时，关于 portfolio sort 曾评价道：

上述选择组数的做法听上去是如此的理所应当，以至于没有谁会质疑它的合理性。然而事实真的如此吗？从数学上说，portfolio sort 其实就是 nonparametric cross-sectional regression estimator。Cochrane (2011) 里面的这张图清晰地表明了这一点。

作为一个 nonparametric/kernel estimator，portfolio sort 却是一个非标准化的方法。比如，从 kernel estimator 的角度来理解，每个分组中的 asset 的收益率估计值就由其所在组的所有 assets 的收益率均值决定。然而，portfolio sort 的非标准之处在于临界资产的分组。比如，以上图中的 log(B/M) 为例，如果某个公司的数值稍稍小了一点，那么它就可能被划分到第 1 组，如果它的数值稍稍高了一些，它就会被划分到第 2 组。这种跳变和 kernel regression 中常见的 kernel 完全不同（比如 Gaussian kernel）。因此，尽管 portfolio sort 简单好用且在实证研究中发挥了重要的作用，但人们对它的统计特性却知之甚少。

除了上面提到的问题之外，另一个问题是股票数据是 unbalanced data，意味着截面上的股票个数会随时间会发生巨大的变化。以下图为例，它展示了 CRSP 中所有股票以及 NYSE 上市的股票的数量随时间的变化。就全部股票而言，在 1960 年之前截面上不足 2000 支股票；然后在 70 年代发生了跳变，并在 90 年代上升至将近 8000 支；最近 20 年又逐渐下降至 4000 支。面对如此巨变的截面股票数量，我们不禁要问，忽视股票数量的变化而一直采用 10 分组是否合理？如果不甚合理，那么应该如何确定最优的分组数？这个最优的分组数又是否和截面上的股票数量有关？

毫无疑问，继承自 Fama and French 的 portfolio sort 承载和见证了实证研究的过去。但展望未来，通过将 portfolio sort 视为 nonparametric estimator，了解其性质，并回答上面提到的那些问题，才代表着实证研究方法的进步。

3 未来

Cattaneo et al. (2020) 对上述问题进行了系统的回答。

该文通过将 portfolio sort 视为一个 nonparametric estimator，提出了一个关于它的估计和推断的通用框架，并介绍了有效的渐近推断方法。它通过最小化估计量的均方误差，为挑选最优分组数提供了理论依据。他们的研究发现，最优的分组数和总的期数以及截面上的资产个数二者皆密切相关。

我们借用该文的图 1 从直觉上理解一下背后的原因。

其中 K 是一个依赖于数据生成过程的常数。对应到实证，最优的分组数远大于常见的 10 组这个选择，随截面上 assets 个数不同，最优的分组数的变化范围从数十到上百。值得一提的是，上述公式是对于构造异象而言。对于构造因子，Cattaneo et al. (2020) 给出了一个类似的关系。

在实证方面，该文以 size 和 momentum 为例，对比了他们的方法和传统的分 10 组方法（下图展示了动量的结果，左侧为该文的方法，右侧为常规的 portfolio sort 结果）。从结果可知，1980 到 2015 这个实证区间中，投资于过去的输家所导致的损失在增大：在整个实证区间内，输家组的平均收益率约为 -0.8%，而在 1980-2015 的区间内这个数值下降到 -1.5%。因此，动量因子的空头部分使该因子在这个区间更加有利可图，且这一结论在排除金融危机等情况下依然稳健。反观传统的 portfolio sort 方法，它并不能提供同样的发现。

除单变量排序外，Cattaneo et al. (2020) 还对他们的 estimator 进行了扩展，使其可以同时考虑多个变量，进行多变量排序。鉴于双重排序在构造因子时十分常见，这种扩展显得尤为必要。但另一方面，和传统的多变量排序一样，他们的 estimator 也受到维数灾难的影响，即随着用于排序的变量的数量的增加，其性能会下降。为了解决这个问题，他们进一步允许其他条件变量以参数的形式进入模型。这种拓展在 portfolio sort 和 cross-sectional regression 之间实现了一定程度的融合，但又不像纯粹的 regression 那样施加了参数化的假设，因此更加灵活。

无论是构造定价因子，还是构造 test assets 来检验多因子模型，portfolio sort 都至关重要。优秀的 test assets 应该能体现出资产收益率在 cross-section 的差异。从这个角度上说，忽视数据的特征而对所有变量都一视同仁、分成 10 组的做法确实略显粗糙。Cattaneo et al. (2020) 为 portfolio sort 确定最优分组数量提供了一种数据驱动方法，并表明最优分组数量随期数以及截面上资产的个数而变化，为今后关于异象和因子的研究提供了新的启发。

参考文献

Black, F., M. C. Jensen, and M. Scholes (1972). The capital asset pricing model: Some empirical tests. In M. C. Jensen (Ed.), Studies in the Theory of Capital Markets. New York, NY: Praeger.

Cattaneo, M. D., R. K. Crump, M. H. Farrell, and E. Schaumburg (2020). Characteristic-sorted portfolios: Estimation and inference. Review of Economics and Statistics 102(3), 531 – 551.

Cochrane, J. H. (2011). Presidential address: Discount rates. Journal of Finance 66(4), 1047 – 1108.

Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests. Journal of Political Economy 81(3), 607 – 636.

免责声明：
您在阅读本内容或附件时，即表明您已事先接受以下“免责声明”之所载条款：
1、本文内容源于作者对于所获取数据的研究分析，本网站对这些信息的准确性和完整性不作任何保证，对由于该等问题产生的一切责任，本网站概不承担；阅读与私募基金相关内容前，请确认您符合私募基金合格投资者条件。
2、文件中所提供的信息尽可能保证可靠、准确和完整，但并不保证报告所述信息的准确性和完整性；亦不能作为投资决策的依据，不能作为道义的、责任的和法律的依据或者凭证。
3、对于本文以及文件中所提供信息所导致的任何直接的或者间接的投资盈亏后果不承担任何责任；本文以及文件发送对象仅限持有相关产品的客户使用，未经授权，请勿对该材料复制或传播。侵删！
4、所有阅读并从本文相关链接中下载文件的行为，均视为当事人无异议接受上述免责条款，并主动放弃所有与本文和文件中所有相关人员的一切追诉权。

Portfolio Sort 的源起、中兴和未来

川总写量化

推荐阅读

评论

友情链接

帮助中心

联系我们