1
交易成本的组成与定义
随着量化策略交易频率的逐步升高,以及单个标的交易金额随整体管理规模的上升而增大,交易成本对投资收益的影响变得愈发不可忽视。传统的简单滑点方式估计交易成本,已越来越难适应高频换仓与大金额下单的场景。因此,如何更好地预测交易成本,在整个量化策略的设计中正在占据越来越重要的地位。
结合海内外的实践经验,我们认为,一笔交易的成本通常可以分解为以下5个组成部分:
- 价格走势;
- 价格波动;
- 买卖价差;
- 盘口流动性;
- 限价单成交概率。
上述5个组成部分对不同类型算法交易策略的影响有显著差异,同时,不同组成部分的预测难度也相去甚远。
1.1 价格走势
从绝对收益角度来看,价格走势对于交易成本的影响往往最为显著,逆势交易所支付的成本远超其他成本的组成部分。假设昨日收盘后,我们综合各类信息打算在今日对投资组合进行调仓。那么,这个调仓的交易过程相当于买入相对看好的股票,卖出相对看空的股票。交易的目标便是保证所交易标的尽可能保留当日涨跌幅,从而接近策略的理论效果,因为策略理论上是按昨日收盘价调仓的。
于是,我们可定义收益保留比例为:
即,成交价(TradePrice)相对今收盘价的收益率与前收盘价相对今收盘价的收益率之比。为避免歧义,上述定义暂不考虑前收盘价和今收盘价相等的情形。该比值越大,代表交易的保留收益越高。若比值大于1,则代表从交易中获取了超额收益;若比值小于1,则代表交易过程产生了损失。
将全天的交易时段从集合竞价开始,以半小时为周期进行划分。其中,集合竞价为第一个单独的交易时段。考察每个时段内以每秒的TWAP交易,所得的全市场股票的平均收益保留比例,结果如图1所示。
从集合竞价开始,随着交易时段的延后,收益保留比例单调下降。平均而言,在集合竞价时段完成交易,能保留当日90%的收益率;而到了开盘后半小时,收益保留比例快速下降至60%;如果在每日的最后一个小时交易,仅能保留当日10%的收益率。
因此,我们认为,在不考虑市场和个股流动性的前提下,越靠近开盘交易,就越有可能实现预期的策略效果。推广到日内信号型策略,越靠近信号触发时点交易,就有更大概率实现交易信号的逻辑,获取对应的预期收益。
1.2 价格波动
假设每分钟都以每秒的TWAP成交,我们进一步考察开盘半小时内(包括集合竞价)的平均收益保留比例(图2)。同样地,在首个半小时内,也是越靠近开盘成交,收益保留比例越高。平均而言,从9:30的80%左右单调递减至9:59的50%左右。
然而,由于越靠近开盘,分钟内成交价的波动也越剧烈,因此,收益保留比例的不确定性就会大幅提高。如下图所示,开盘第一分钟内,收益保留比例的波动率就高达40%;即使是开盘后的第5分钟,波动也高达20%以上。
由此可见,价格波动的幅度对收益保留比例有着重要影响。越靠近开盘时段交易,就越有可能遭遇较大的价格波动,造成收益保留比例大幅降低,甚至带来额外的交易成本。因此,在成本预测过程中,除了价格走势,还需纳入价格波动这一要素。
1.3 买卖价差
在前两个小节中讨论交易成本影响因素时,我们都假设交易是按TWAP完成的,这其中并未考虑主动买入或主动卖出的情形。当分钟内出现单边行情,即在单边上涨过程中买入或在单边下跌过程中卖出,想要完成交易就必须下市价单。那么,以每秒的TWAP作为期望的成交价,必然会在一定程度上低估交易成本。
因此,我们认为,买卖价差也是交易成本的一个重要组成部分,而它产生的影响可以通过如下这个简单的例子予以说明。
假设开盘后半小时内,每分钟的交易都以市价单,即对手方最优价格完成,那么最终的交易成本相对每秒TWAP成交的交易成本的增幅,如下图中的虚线所示。平均而言,市价单成交将增加8-18个bps的额外成本。而且,越靠近开盘,成本的增幅越大。例如,开盘第一分钟,市价单成交的额外成本接近2‰。
观察上图,我们还发现,市价单买入或卖出产生的额外成本的均值约等于买一卖一价差。因此,我们可以通过预测买卖价差,估计市价单成交的额外成本。
当然,完全以市价单成交是非常极端的情形,但实际交易都由限价单完成同样很难实现。故我们要承担多少市价单的额外成本,就与交易时的盘口流动性息息相关。
1.4 盘口流动性
以上三个交易成本的组成部分——价格走势、价格波动与买卖价差,只考虑了价格对交易成本的影响。当我们需要交易的量很小,同时市场流动性又很充足时,只考虑这三个因素已经足够。然而,当我们的单笔下单量较大,而市场流动性又不足时,那就有可能在价格之外产生非价格因素的额外成本。
下图一般被称为盘口流动性表,它展示了开盘后半小时内,承担不同额外成本下,全市场股票每分钟所能即时成交的量占其自由流通股本比例的均值。其中,红色和绿色分别代表委卖和委买盘口。<=0.5‰表示承担0.5‰以内非价格因素的额外成本,所能获得的即时成交量占比。
从时间维度来看,越靠近开盘,流动性越差。此时,想要获得相同的成交量,需要负担更多的额外成本;或者说,承担相同的额外成本,获得的成交量更少。从同一时刻上的买卖对比来看,买盘的流动性一般优于卖盘。故绝大多数情况下,卖出股票所需付出的额外成本更小。
1.5 限价单成交概率
上文介绍的四个因素未必都会影响交易成本。例如,若所有成交都以限价单完成,那么,买卖价差和盘口流动性就与成本无关,价格走势和价格波动是唯二的决定因素。实际上,限价单成交概率决定了前四个因素中的哪几个会对成本产生影响,所以我们可以将它视为第五个因素。
然而,预测限价单成交概率也绝非易事。但可以想见,它与股价的涨跌应当有着较强的相关性。定义下一个3秒内,1档盘口以外委托单的成交量为限价单成交量,与全天成交量的比值为限价单成交概率的近似。它与同分钟的涨跌幅及1档盘口流动性的相关性如下图所示。不论是买入还是卖出,限价单成交概率与分钟涨跌幅的相关性约是它与盘口流动性相关性的20倍以上。
2
不同交易策略的成本预测方法与效果
2.1 不同交易策略的成本影响因素
从拆单方法来看,算法交易可分为TWAP与VWAP两类;而从拆单后的下单模式来看,可分为纯市价单与限价单优先两类。两两组合,可得以下四种算法交易类型。
1. 基于TWAP的纯市价单策略
2. 基于TWAP的限价单优先策略
3. 基于VWAP的纯市价单策略
4. 基于VWAP的限价单优先策略
这四种算法交易模式的复杂度由简入难,其成本的影响因素也由少到多。
首先,VWAP拆单相较TWAP拆单可以在理论上更加贴近当日成交状况。尤其是当下单金额较大时,可以尽可能避免流动性不足导致的额外成本。但VWAP拆单需要预测当日的成交分布,因而预测准确率也会对成本产生较大影响。
其次,限价单优先的下单策略相较纯市价单策略,理论上会更节省成本。理想状态下,如果所有订单均以限价单成交,则完全不需要承担1.3节中介绍的买卖价差成本。但由1.5节可知,限价单成本节省的效果与其成交概率正相关。限价单成交的概率越高,买卖价差成本的节省效果越好;限价单成交概率越低,除了无法节省买卖价差成本外,还可能需要承担更高的盘口流动性成本。
为降低成本预测的复杂度,我们假定下文交易成本的测算均以TWAP理论成交价为基准,暂不考虑VWAP成交的情形。
理论上,价格走势是成本的首要影响因素,这也是我们在介绍成本的组成部分时,把它第一个提出来的原因。不过,对价格走势的判断也是收益预测模型关注的核心。因此,为避免引入更复杂的模型和更多的不确定性,我们暂不考虑价格走势对成本的影响。这样一来,不同TWAP交易策略的成本影响因素可以归纳为,
基于TWAP的纯市价单策略:价格波动、买卖价差、盘口流动性。
基于TWAP的限价单优先策略:价格波动、买卖价差、盘口流动性、限价单成交比例。
2.2 基于TWAP的纯市价单策略的成本预测
2.2.1 基于TWAP的纯市价单策略的成本预测方法
基于TWAP的纯市价单策略只受价格波动、买卖价差和盘口流动性影响,故我们只需分别预测这三个因素。
我们定义,价格波动导致的成本约等于分钟成交价相对前收盘价收益率的标准差。
由于收益率的波动有聚集性,因此预测第i分钟的波动率时,我们使用了过去五个交易日的第i分钟价格波动的滑动平均作为预测值。如下图所示,开盘后的一分钟,全市场股票价格波动的平均预测误差(预测误差:预测值和真实值之差的绝对值,下同)的均值为14bps,80%分位数为17bps,均为10点前峰值。随后,平均预测误差的均值逐步下降至4bps左右,80%分位数也同步下降至5bps左右,并同时保持稳定。虽然开盘后的误差较大,但平均误差百分比始终在44%至50%之间,与交易时段无关。
我们用同样的方式预测买卖价差,即,取过去5个交易日同一分钟内买卖价差的均值作为当日该分钟买卖价差的预测。如下图所示,买卖价差的预测精度显著优于价格波动,平均预测误差的均值在2-6bps之间,平均误差百分比在28%-32%之间。
与前面两个因素的预测效果相比,盘口流动性的预测效果则要差得多。如下图所示,不同时点上的平均误差百分比都在40%以上。尤其是在买一和卖一(额外成本=0‰)处,平均误差百分比将达到60%,甚至70%以上。
有了这三个要素的预测,纯市价单策略相对于同时段TWAP的成本可写为,
其中,VolCost_min表示价格波动成本,DiffCost_min表示买卖价差成本,SheetLiqCost_min表示盘口流动性成本。
但需要注意的是,图6-8展示的预测都假设每秒交易1次,即每分钟交易60次。但在实际交易中,囿于网络延迟、柜台处理能力不足等因素,很难实现每秒交易。因此,真实的成本也将受到交易次数的影响。
我们假设每分钟的交易次数为n(n<=6),那么价格波动成本变为在样本数为N(=60)的总体中抽取n个样本后,这些样本的标准差:
其中,PreVolCost_min为上文预测的分钟波动率。β是一个经验参数,代表投资者对市场环境的判断。如果认为流动性较差,抽样价格将会较大幅度偏离TWAP,那么可以适当地调高β;反之,较小的β代表投资者有信心接近TWAP。若β=0,则表明不存在价格波动成本。显然,当其他变量相同时,分钟内的下单次数越多,价格波动成本越低。例如,每分钟交易6次的价格波动成本大约仅为交易1次的39%(=3/√59)。
需要注意的是,有关价格波动成本和买卖价差成本的预测,本节都提出了简洁的方法。但对于盘口流动性成本,我们只通过图8展示了预测误差,并未给出具体的预测方式。这是因为,盘口流动性成本通常无法用一个简单的公式描述。常见的做法是,事先基于历史交易数据,绘制类似图4的盘口流动性表;随后根据交易量和交易时间,查表获得盘口流动性成本。
2.2.2 基于TWAP的纯市价单策略的成本预测效果
我们以沪深300、中证500、中证1000三个主流宽基指数的1800只成分股作为研究对象,采用纯市价单策略,以每个股票分别交易100万、1000万、5000万和1亿元进行买卖模拟测试。考察2021.07-2022.09期间,不同交易金额下,预测的成本和利用真实行情模拟撮合的成本之间的差异。
如以下4图所示,随着单个股票交易金额的上升,预测误差也逐渐扩大。但是,选择合适的β,却可以获得相对更优的效果。当交易金额较低时(图9-10),较小的β可使预测成本更贴近真实值;一旦交易金额较高(图11-12),较小的β对应的预测误差反而更大。此时,调高β,更加保守地预测成本是相对合理的选择。
除了成交金额,不同时段的预测误差也有明显的差异。例如,2021年12月至2022年4月,市场下跌幅度较大,成交量也明显萎缩。在此期间,不同交易金额的成本预测精度普遍下降,预测误差相比其余时期大幅上升。
相比简单的滑点方式,上文介绍的预测方法既可以灵活地反映交易金额对成本的影响,又可以显著地区分不同股票交易成本的差异,从而使策略回测更加符合实际。
下表展示了不同交易金额和β下,使用本文方法和滑点方式的成本预测误差。首先,当交易金额较小时(100万元或1000万元),滑点方式不失为一种简单却行之有效的预测。其平均误差与本文方法的结果并无显著区别。但当交易金额较大时(5000万元或1亿元),滑点方式相比本文方法的预测精度就要差很多了。
其次,预测成本与真实成本之间较高的IC则表明,本文的预测方法对不同股票的真实交易成本有较好的截面区分度。尤其是随着交易金额的提升,本文方法捕捉股票间交易成本差异的能力也在逐渐增强。
第三,和图9-12的结论一致,参数β也会影响预测误差。从我们的回测结果来看,β取0.5在4种不同交易金额下都是相对较优的选择。
进一步分别在三个主流宽基指数的成分股内,按照指数权重分配交易金额后(总交易金额=第二列的金额*成分股数量,下同),再计算成本预测误差,结果如下表所示。
对于成分股流动性很好的沪深300指数,较小的β通常都对应更小的预测误差;对于流动性不如沪深300的中证500指数,当交易金额较大时,更保守的β(0.5或1)设定,可以减小预测误差;而对于流动性在三者中最差的中证1000指数,除非每个股票的交易金额较小,如,100万,否则我们都应该选择较大的β参数来预测成本。
2.3 基于TWAP的限价单优先策略的成本预测
2.3.1 基于TWAP的限价单优先策略的成本预测方法
限价单优先策略是指,先尽可能以限价单形式成交,再将未成交部分以市价单强制成交。所以,在预测成本时,也要对限价成交和强制市价成交两部分单独进行,再按成交比例合成。由于限价成交部分的成本只与价格波动有关,因此,最终的预测成本为,
其中,VolCost_(l,min)与VolCost_(m,min)分别代表限价单和市价单的价格波动成本,它们的计算公式相同,但下单次数n会随不同的下单策略变化。Weight_(l,min)与Weight_(m,min)分别代表限价单和市价单的成交占比,具体数值由下单策略、股票价格走势等多重因素决定。而由前文可知,该参数的预测难度很大,故后文将通过人为设定,对其进行简化。
2.3.2 基于TWAP的限价单优先策略的成本预测效果
首先,我们将限价单优先策略设定为,对于每分钟的欲交易量m,在前半分钟先尝试三次限价单成交。第一次下单量为m/3,后两次下单量为m/3加上前序下单的未成交部分;后半分钟则将前半分钟的未成交部分等分为3份,分三次以市价成交。
随后,我们对中证800+中证1000的成分股,并假设每个股票的交易金额为100万、1000万、5000万和1亿元,采用等权或按指数权重再分配交易金额两种方式,分别利用限价单交易策略进行买卖模拟测试,得到的限价单成交比例如下表所示。
同样的交易金额,买入和卖出的限价单成交比例并无显著差异;但不论是哪个指数或何种交易金额分配方式,随着交易金额的上升,限价单成交比例都显著下降。若按指数权重分配交易金额,则金额大小和成分股流动性的影响更甚。同样是从100万变为1亿,沪深300的买卖平均成交比例仍有36%,而中证500和中证1000均不足20%。
参考上表中等权交易的测算结果,我们假定每只股票的交易金额为100万、1000万、5000万和1亿时,对应的限价单成交比例为50%、40%、20%和10%,那么在2021.07-2022.09期间计算得到的交易成本预测误差如以下4图所示。
与纯市价策略相比,限价单优先策略的预测误差更高,但β对误差的影响程度则要更低。可能的原因是,人为设定的限价单成交比例与实际情况存在差异,使得β对预测结果的影响能力变弱。
下表进一步展示了限价单优先策略在不同β和交易金额下的平均预测误差。和简单的滑点方式相比,本文方法的预测虽然精度相对更高,但却明显不及表1中的纯市价策略。这是因为,根据模拟撮合的结果,我们设定的限价单成交比例远低于实际,导致更多的成交是遵循纯市价策略的成本预测方法,从而引入了本不该有的价差成本与盘口流动性成本。同时,更高的市价单成交比例也会显著推高盘口流动性成本,使成本预测更保守。
我们进一步根据指数权重分配交易金额,计算三个主流宽基指数成分股交易成本的平均预测误差。如下表所示,相较简单滑点法,本文方法在限价单优先策略中对成本预测误差的改善,尤其是在交易金额较大时,明显不及表2中的纯市价单策略。
3
总结
3 总结
交易成本是投资过程中的重要一环,本文根据海内外的实践经验,将其分为价格走势、价格波动、买卖价差、盘口流动性、限价单成交概率五个部分,它们对于不同交易策略的影响程度也各不相同。因此,深入探究每个组成部分对成本的作用机制,分析哪些部分是可预测的,哪些又相对难以预测,对更为精准地预测交易成本非常重要。
本文通过两个基于TWAP的纯市价单和限价单优先策略,展示了交易成本的预测方法,并将其与简单的滑点方式进行了对比。对于纯市价单策略,由于不涉及成交概率这一较难预测的因素,故最终的成本预测误差显著优于滑点方式;而对于限价单优先策略,限价单成交概率的预测准确性很大程度上决定了最终的成本预测效果。我们认为,虽然本文介绍的这两种方法都对市场和预测过程做了诸多简化,有效性有待商榷,但仍不失为研究交易成本预测的一个良好起点。
对于交易频率较高的量化策略而言,理论上美好的策略能否付诸实践,很多时候都依赖于更准确的交易成本估计。例如,在构建量化组合时,我们可以把每个想交易的股票的成本预测当作惩罚项加入优化目标,取代简单的统一滑点惩罚,从而尽可能避免回测结果和样本外的应用效果有较大差距。当然,交易成本的预测还有很多不同的应用场景,这也是我们未来研究的一个重要方向。
4
风险提示
4 风险提示
市场系统性风险、模型误设风险、有效因子变动风险。
本文来自微信公众号“海通量化团队”,文章版权归原作者所有,内容仅供参考并不构成任何投资及应用建议。