「统计信仰」金融世界的贝叶斯之旅

SerendipityCamp
24603-18 13:22
好投课代表敲重点啦!!!贝叶斯统计在金融领域的未来前景十分广阔。其天然优势在于处理非线性和肥尾数据,同时兼容个性化投资策略。随着金融数据爆炸性增长,贝叶斯统计在大数据处理方面的优势将更为显著,揭示市场模式和趋势。

作者:SerendipityCamp

题图:SerendipityCamp微信公众号


贝叶斯之旅

1987年10月19日,道琼斯工业平均指数暴跌22%,而标准普尔500指数下跌20%。这并非正态分布所预测的——毕竟回报率超过平均值3个标准差。此外,正收益和负收益出现的频率也并不相等——资产回报带有显著的肥尾和非对称性特点。

收益缺乏正态性,意味着风险的概念比标准差(传统上使用的风险度量)所能反映的内容更丰富。对于投资者而言,投资盈利的风险是喜闻乐见的,而任何理性的投资者都会尝试避免承担赔钱的风险并主动规避——标准差无法解释这种不对称的投资者偏好。

这些发现也已经是投资者的共识,这些市场特点也被考虑进了实际的投资组合构建和风险管理的定量模型。

Markowitz在1952年提出的通过评估单个证券对风险的贡献,来最小化投资组合风险的投资组合范式,也是富有市场洞察力的。但它已经不再好用,问题在于,经典均值-方差框架内推导的投资组合可能达不到最优性,因为未能识别出与收益的非正态性相关的风险成分(见「最优狂热」基金误入歧途的现代投资组合理论论)。

类似地,协方差矩阵不一定包含关于资产回报之间相关性的所有信息。例如,为了评估投资组合风险,往往需要考虑市场下跌时对回报的依赖性比上涨时更强,以及极端回报同时发生的趋势。

显然,我们需要超越传统的频率论的, 一种基于贝叶斯框架的模型估计,因为贝叶斯方法并不依赖于特定的统计分布——贝叶斯方法允许使用非参数化技术来估计资产回报的分布,这意味着它不需要预先假设数据遵循特定的分布(如正态分布)。这对于处理投资回报的非正态性特别有用。

贝叶斯方法的优势还在于,它提供了一种量化不确定性的方式,这在投资决策中非常关键。通过后验分布,投资者可以直观地了解参数估计的不确定性,而不仅仅是一个点估计。这有助于更好地评估风险。

我们还将看到,贝叶斯方法还能处理数据稀缺和噪音问题:在实际应用中,经常会遇到数据稀缺或数据质量不高的问题。贝叶斯方法通过引入先验知识,可以在数据不足或数据噪声较大的情况下,提供更稳健的估计。而最大熵原理(以及最大无知概率)甚至提供了无信息情境下的贝叶斯估计方法。

最后,通过贝叶斯网络或其他贝叶斯模型,可以更有效地捕捉资产回报之间的复杂关系,包括非线性关系和依赖性。这对于构建一个能够在各种市场条件下表现良好的投资组合至关重要。

MIP最大无知概率

Maximum ignorance probability,这个Taleb新近提出的术语,并不是一个广泛认可或标准的概率论或统计学术语。从字面意义上理解,它可能指的是在完全无知的情况下,某一事件发生的最大概率估计。这个概念与最大熵原理(maximum entropy principle)相关(见《统计信仰》第四章),最早来自信息理论和统计物理。

最大熵原代表了一种原则或方法,用于在仅知道有限的先验信息的情况下,推断或预测一个未知分布。它基于的想法是,在满足已知约束的所有可能分布中,选择熵最大的那一个分布作为最优估计。

如果我们将“maximum ignorance”理解为对一个系统或事件知之甚少或一无所知,那么在这种情况下,最大熵原理可以提供一种方法来处理这种无知,通过选择最不偏不倚(即最“公平”或最不具体)的概率分布来最大化熵。

例如,在掷骰子的情况下,如果我们没有任何信息表明面比其他面更有可能出现,那么我们将每个面出现的概率都设为1/6,这是在最大无知(即每个结果都同样可能)的条件下的最大熵分布。

一个胸外科医生做了60次成功的手术,0伤亡,那么如何最大无知概率来计算医生手术失败的概率?

最大无知概率是一种在完全不知道先验概率时,用来估计一个事件概率的方法。这种方法常用在贝叶斯统计中,尤其是在面对不确定性很大的情况下。

在贝叶斯统计中,最大无知原则通常意味着使用一个均匀的先验分布。这意味着在没有任何信息的情况下,我们假设所有可能的概率(从0到1)都同样可能。因此,我们可以使用一个贝塔分布作为先验分布,它在参数为1时表示均匀分布(Beta(1,1)),这相当于在观察到任何数据之前,我们认为所有的概率(从0到1)都是等可能的。

一旦我们有了先验分布,接着我们要更新这个分布基于我们观察到的数据。在这个例子中,数据是60次成功的手术(没有失败)。在贝塔分布中,成功的手术会增加第一个参数的数量,而失败的手术会增加第二个参数的数量。因此,观察到60次成功之后,后验分布将会是Beta(成功次数+1, 失败次数+1) = Beta(61, 1)。

要计算手术失败的概率,我们通常会查看后验分布的期望值。Beta分布的期望值是 α / (α + β),其中α和β是Beta分布的参数。在我们的例子中,这将是 61 / (61 + 1) = 61 / 62。但注意,这实际上是成功的概率。要得到失败的概率,我们需要计算 1 - 成功的概率 = 1 - 61/62 = 1/62。

不过,这个计算过程中有个误解,我们实际应当寻找的是失败的期望概率,而不是成功的。正确的失败概率的计算应该直接基于Beta分布的期望值公式,针对失败的情况:β / (α + β)。对于我们的Beta(61, 1)分布,失败的期望概率其实是 1 / (61 + 1) = 1 / 62。

因此,根据最大无知原则,我们估计这位医生手术失败的概率是1/62,或大约1.61%。

这个方法提供了一种在完全没有失败案例时估计失败概率的方法。不过,值得注意的是,这种方法依赖于贝叶斯方法论和最大无知先验的选择,可能不总是反映实际情况。它提供了一种在完全没有失败案例时的估计,但实际的失败概率可能因为许多未考虑的因素而有所不同。

回到金融领域,理解和应对市场风险是核心议题之一。量化金融通过构建数学模型和算法来预测市场行为、评估风险和制定交易策略。在这个过程中,"maximum ignorance probability"这个概念可以视为一种哲学工具,帮助我们从一个不确定性更高的视角来审视风险管理。

即在完全不了解一个系统的具体状态时,假设所有可能结果发生的概率相等。将这个概念应用到金融市场风险管理中,可以解释为在极度不确定的市场环境下,采取一种保守的策略,即不对任何特定市场走向做出偏见性预测,而是赋予所有可能性以平等的重视。

应对市场风险,特别是在极端不确定性的环境下,我们可以将maximum ignorance probability的思想应用于:

  1. 多元组合:通过构建一个多样化或风险免疫的投资组合来分散风险,避免对任何单一资产或市场做出过度投资(Taleb已经独立推导出了这个观点,见「左尾与杠铃」尾部风险约束和最大熵)。
  2. 保守配置:倾向于(尤其是在无信息的情境下)保持较高的现金或等价物水平,以备不时之需。
  3. 灵活调整:灵活调整投资策略,快速响应市场变化。最大无知概率通常会伴随信息的增加而收敛,先验的持续更新,这是典型的贝叶斯特点。

在缺乏额外信息的情况下,最大无知概率通过最大化熵的方式来保证选择的概率分布尽可能无偏,即不引入任何未经证实的假设。它尊重已知的信息,同时对未知的情况保持最大程度的中立。

最大熵原理确保了在利用所有已知信息的同时,不对未知信息做出任何主观假设。这意味着最终选择的概率分布是在给定条件下信息含量最大的分布,它包含了所有可能的情况而没有任何额外的限制或偏见。

最大熵原理实质上是在寻找一种“最不偏不倚”的概率分布,它遵循已知条件但在此基础上尽可能保持开放和包容性,避免引入任何未经证实的先验知识。这样的贝叶斯(见「贝叶斯的诅咒」偏见的胜利与因果性的破灭)处理方式使得最大熵原理在处理不确定性和信息不完全问题时显得尤为强大和有用。

更重要的是,最大熵原理通常可以通过数学和计算方法实现,比如利用拉格朗日乘数法来求解约束最优化问题。这使得最大熵原理不仅在理论上吸引人,在实际问题中也具有可操作性。

综上,maximum ignorance probability可以作为量化金融在极端市场里,保守应对市场风险的一个可靠的辅助工具,一旦我们对市场有了更多的了解,掌控了更多的信息后,我们再结合其他风险管理方法,以实现更全面和有效的风险控制。

BL模型

1990年代,Fischer Black和Robert Litterman在贝莱德集团(BlackRock)工作时提出了一种结合了主观判断与市场均衡回报的投资组合选择框架——Black-Litterman模型。

这种方法通过贝叶斯公式来融合投资者的个人观点和市场均衡回报,以此来改进传统的马科维茨(Markowitz)投资组合优化模型(见「最优狂热」基金误入歧途的现代投资组合理论论),后者仅基于历史数据来预测未来回报率和风险,而不考虑投资者的主观预期。

Black-Litterman模型体现贝叶斯思维的核心在于它如何处理和更新信息。在贝叶斯框架下,先验信念(或信息)在遇到新证据后会被更新,形成后验信念。该模型使用市场均衡回报作为先验分布,然后根据投资者的特定观点调整这些回报,得到后验分布。

具体而言,Black-Litterman模型的贝叶斯应用可以分为以下几个步骤:

  1. 设定先验分布:模型以市场均衡回报作为先验分布。这些均衡回报通常是通过反向优化市场投资组合获得的,即假设市场是有效的,然后求解在这一假设下的资产预期回报率。
  2. 表达个人观点:投资者可以有关于某个资产或资产组合未来回报的特定观点。这些观点可以是相对的(例如,资产A将超过资产B的回报)或绝对的(资产A将有X%的回报率)。
  3. 结合个人观点和市场信息:通过贝叶斯公式,将个人观点(作为新信息)与市场均衡回报(先验信息)结合起来,调整预期回报率,得到后验分布。这一步骤通常涉及到计算一个加权平均,其中权重依赖于个人观点的信心水平。
  4. 投资组合优化:根据更新后的回报预期(后验分布)和风险估计,使用Markowitz优化模型来确定最优投资组合。

通过这种方式,Black-Litterman模型允许投资者将自己的主观预期以一种系统化和量化的方式纳入投资决策中,同时通过贝叶斯更新来减轻过度拟合历史数据和过度自信个人观点的风险。这种结合了主观与客观、先验与后验的方法为实现更加平衡和个性化的投资组合选择提供了强大的工具。

Meucci方法

在投资组合风控领域,Attilio Meucci也提出了全面的数学和统计学框架,来理解和实施投资策略,这不光是贝叶斯化,从静态持有转变为资产配置的动态调整,Meucci还提出了尾部风险度量,以及Copula函数的非正态假设,来替代Markowitz的正态性假设。

Copula函数的核心思想是将多变量联合分布与变量的边缘分布分离开来。这是基于Sklar定理的,该定理指出任何多维联合分布都可以分解为边缘分布和一个Copula函数,后者描述了变量之间的依赖结构。数学上,假设我们有两个随机变量 (X) 和 (Y),它们的边缘分布函数分别为 (F_X(x)) 和 (F_Y(y))。Sklar定理表明存在一个Copula函数 (C),使得随机变量 (X) 和 (Y) 的联合分布函数 (F(x, y)) 可以表示为:

[F(x, y) = C(F_X(x), F_Y(y))]

边缘分布 (F_X(x)) 和 (F_Y(y)) 描述了各自变量的分布特性,而Copula函数 (C) 则精确捕捉了 (X) 和 (Y) 之间的依赖关系。

Copula函数在统计模型中引入了非正态性——它能够描述和模拟不同随机变量之间的依赖结构,而不受这些变量边缘分布的限制。这意味着,通过使用Copula函数,研究人员和分析师仍然可以构造一个模型来精确描述变量之间的复杂依赖关系,即使这些变量遵循非正态分布。

虽然Copula函数本身并不具备贝叶斯性质,但它可以存在贝叶斯分析框架内使用,与贝叶斯方法的结合来进行概率推断,Meucci方法实际是结合了两种方法的优点:Copula函数在建模复杂依赖性方面的灵活性,以及贝叶斯方法在整合先验知识和处理不确定性方面的能力。

值得注意的是,Meucci的方法相比于Black-Litterman模型而言,更加贝叶斯化,Black-Litterman模型是一种结合投资者主观观点与市场均衡回报的资产配置模型。它通过对CAPM市场均衡回报的修改,融入投资者的主观观点,旨在解决传统Markowitz均值-方差优化模型中存在的敏感性和不实际的投资组合权重问题。

Meucci在对Black-Litterman模型的改进中,提出了一种更加灵活的观点表达方式。在传统模型中,投资者的观点通常被限制为对特定资产或资产组合回报的直接预测。而Meucci提出的方法允许投资者表达更为复杂和多样的观点,比如关于资产回报分布的不同方面(如波动性、偏度等),以及资产之间关系的观点(相关性)——这种灵活性使得投资者可以更加准全面地表达自己的市场观点。

简单来说,传统Black-Litterman模型中,贝叶斯更新主要用于结合市场均衡返回和投资者观点。而Meucci的框架不仅在这个基础上做了扩展,还允许对模型中的各种不确定性(如预测的不确定性、参数的不确定性等)进行显式建模和更新。

SVM模型

可以将Black-Litterman模型看做是经过贝叶斯思想改造的马科维茨投资组合模型。受此启发,与此相似的,我们是否可以将传统投资领域的经典理论,比如将波动率看做是常数的BSM模型,或依赖于时间的确定性函数,进行贝叶斯化的改造呢?

答案是肯定的——而这不是别的,正是随机波动率模型(Stochastic Volatility Models,SVM)。在随机波动率模型中,资产的波动率本身被建模为一个随机过程,而不是常数。

SVM模型和GARCH模型(见「凸性对冲」理论的溃败和交易者的胜利)非常相似,它们都可以用来描述金融时间序列中波动率的变化特性的模型——特别是在金融市场中资产价格波动率的建模上。

尽管它们的目标相同,即模拟和预测资产收益率的波动性,但前者在建模方式上存在一些关键的不同之处,这种不同带来了更多的自由度:

GARCH模型的核心思想,是将当前的波动率表示为过去波动率和过去误差项的函数。它假设波动率是条件异方差的,即波动率随时间变化而变化,并且是可预测的。

SVM同样是为了解决金融时间序列数据中常见的异方差(波动聚集)问题的——即不同时间点的波动率不同,而且会随时间变化。

但不同之处在于,这里假设资产收益率的波动率本身遵循一个随机过程——即波动率是不可观测的随机变量。这意味着波动率的变化不仅受到过去波动率的影响,还受到一些外部随机冲击的影响。显然,这样的立场会在实际应用中更具解释性,更加稳健。

当然,SVM由于引入了贝叶斯方法,带来了参数估计的复杂性——这将会更加依赖于计算能力——比如马尔可夫链蒙特卡罗(MCMC)等统计技术来进行估计,而非GARCH依赖的极大似然估计的简单形式。

贝叶斯方法通过整合先验信息(过去经验,专家意见等)和观测数据(资产价格数据的变化),来更新对模型参数的认识(为模型参数提供一个概率性的描述)。

虽然看似无关紧要,但这一经典贝叶斯思想的渗入,带来了更多的可能性:通过计算参数的后验分布,我们可以推断未来资产价格的分布,从而应对和处理更多的不确定性。

MER模型

早期的资产定价模型,如资本资产定价模型(CAPM),主要依赖于市场单一因子(即市场组合的超额回报)来解释资产的风险和回报(见金融里的哲学:投机者的自由之路)。然而,研究和实践表明,CAPM不能充分解释所有的股票回报波动。

更好的方式,自然是引入多个风险因子,比如规模、价值、动量等,为股票回报提供更全面的解释。于是,贝叶斯化的Multifactor Equity Risk模型被提出,其多个因子来解释和预测股票收益的波动性和相关性。

这一模型试图通过一系列预先选定的因子(如市值、盈利能力、成长性等)来捕捉股票收益的结构。每个因子对股票收益的贡献(即因子载荷或暴露),以及因子自身的风险(即因子协方差矩阵)是模型的核心参数。贝叶斯方法在这一模型中的应用,使得我们能够以一种更灵活、更具信息量的方式来估计和更新模型参数。

随着科技行业的崛起和全球化以及地缘脱钩等变数,某些因子的重要性可能会发生变化。多因子模型允许灵活地引入新的风险因子,以反映市场的最新发展。

此外,在多因子模型的构建过程中,可能会有多个不同的模型候选,这些模型可能包括不同的因子集合。贝叶斯方法天然提供了一种称为贝叶斯因子的工具,可以用于在统计意义上比较不同模型的拟合优度。这有助于精选出最能解释数据的模型。

假设一个投资者在考虑两个股票投资策略:策略A认为科技股将在未来表现良好,而策略B则认为消费品股将会带来更高的回报。为了决定哪个策略更有可能带来更高的回报,投资者决定使用贝叶斯因子来评估每个策略的相对证据强度。

假设我们有一段时间内科技股和消费品股的回报数据。通过分析这些数据,投资者可以计算出关于两种策略预期回报的似然性(即在给定策略下观察到数据的概率):

1、计算似然性:

假设策略A的似然性是0.6,这意味着给定策略A是正确的,观察到现有数据的概率是60%;

假设策略B的似然性是0.4,即给定策略B是正确的,观察到现有数据的概率是40%。

2、设定先验概率:

在没有看到数据之前,投资者可能认为两种策略同样可能是正确的。因此,策略A和B的先验概率都是0.5。

3、计算贝叶斯因子:

贝叶斯因子(K) = (策略A的似然性 / 策略B的似然性) = 0.6 / 0.4 = 1.5。

贝叶斯因子是1.5,这意味着在观察到的数据下,支持策略A(科技股投资)相对于策略B(消费品股投资)的证据是1.5倍。在这个例子中,虽然贝叶斯因子表明策略A更受支持,但证据并不是非常强烈(通常,贝叶斯因子大于3才被认为是相对较强的证据)。

基于贝叶斯因子的结果,投资者可能会倾向于选择策略A(科技股投资)。然而,考虑到证据的相对强度并不非常高,投资者也许会选择进一步收集信息,或者在两种策略之间分配投资,以分散风险。

通过使用贝叶斯因子,投资者可以量化不同投资策略的相对证据强度,从而做出更为信息化的决策。然而,重要的是要考虑贝叶斯因子的大小,并结合其他信息和投资者自身的风险偏好来做出最终决策。

显然,贝叶斯因子优势很明显,它能够超越频率统计中研究者严重依赖的p值,来判定结果的显著性——它不单单考虑了数据和假设的契合度,也考虑了模型的先验概率。贝叶斯因子的大小可以被解释为证据的强度,并相对p值更直观的量化解释,这让它在复杂的决策问题处理中更胜一筹。

贝叶斯方法的未来

贝叶斯统计学在金融学的未来发展中扮演着越来越重要的角色。

贝叶斯方法在量化不确定性方面存在先天优势,它能够兼容非线性和肥尾的金融世界,生来就具备应对更极端市场风险的潜力。

此外,贝叶斯方法能够处理大量的个性化数据和先验知识,这为开发更加个性化的投资策略提供了可能。通过分析投资者的历史交易数据、风险偏好和市场表现,贝叶斯模型可以作为个人助理,帮助构建更加贴合个人需求的投资组合。

尤其是贝叶斯统计与机器学习的结合,更为金融模型的构建和优化提供了新的可能。贝叶斯机器学习模型能够提供关于预测的不确定性估计,这对于决策制定是非常宝贵的信息。在未来,这种结合可能会进一步促进机器学习在金融领域的应用,如信用评分、欺诈检测和市场分析等。

贝叶斯统计与基于算法的量化交易非常契合,算法交易依赖于强大的数学模型进行自动执行交易,而贝叶斯方法在模型的更新和改进方面具有天然的优势。市场数据的实时分析变得越来越重要,而贝叶斯统计在算法交易中的应用也将进一步增加。

随着金融行业数据量的爆炸性增长,贝叶斯方法在处理大数据方面的优势将更为明显。通过有效地整合和分析大量的市场数据、社交媒体信息和交易数据,贝叶斯统计有助于揭示隐藏在庞大数据集背后的模式和趋势。

总之,贝叶斯统计在金融学领域的未来发展将远远超出我们的预期——它不仅能够为投资决策、风险管理、产品创新和市场分析提供强大的支持,也将推动金融学与数据科学、计算技术和人工智能等领域的交叉融合,开创金融学新的研究和应用方向。

未来已来。


版权声明:文章版权归原作者所有,部分文章由作者授权本平台发布,若有其他不妥之处的可与小编联系。

免责声明:
您在阅读本内容或附件时,即表明您已事先接受以下“免责声明”之所载条款:
1、本文内容源于作者对于所获取数据的研究分析,本网站对这些信息的准确性和完整性不作任何保证,对由于该等问题产生的一切责任,本网站概不承担;阅读与私募基金相关内容前,请确认您符合私募基金合格投资者条件。
2、文件中所提供的信息尽可能保证可靠、准确和完整,但并不保证报告所述信息的准确性和完整性;亦不能作为投资决策的依据,不能作为道义的、责任的和法律的依据或者凭证。
3、对于本文以及文件中所提供信息所导致的任何直接的或者间接的投资盈亏后果不承担任何责任;本文以及文件发送对象仅限持有相关产品的客户使用,未经授权,请勿对该材料复制或传播。侵删!
4、所有阅读并从本文相关链接中下载文件的行为,均视为当事人无异议接受上述免责条款,并主动放弃所有与本文和文件中所有相关人员的一切追诉权。

0
好投学堂
第一时间获取行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「好投学堂」,或用手机扫描左方二维码,即可获得好投学堂每日精华内容推送和最优搜索体验,并参与编辑活动。

推荐阅读

0
0

评论

你来谈谈?
发表

联系我们

邮箱 :help@haotouxt.com
电话 :0592-5588692
地址 :福建省厦门市湖里区航空商务广场7号楼10F
好投学堂微信订阅号
扫一扫
关注好投学堂微信订阅号
Copyright © 2017-2024, All Rights Reserved 闽ICP备19018471号-6