华泰证券丨机器学习模拟投资者分歧

好投学堂
13806-18 16:07

来源:华泰证券

作者:林晓明、何康

编辑:好投学堂


人工智能系列之 80:机器学习用于模拟投资者分歧

投资者分歧是推动交易的原因之一,对金融市场的资产定价具有重要意义。本文运用机器学习来模拟投资者分歧。将不同的特征集输入给多个机器学习模型,模拟投资群体接收差异化信息源、并产生不同投资预测的过程。最后,根据模型预测差异构建的分歧度因子,能够有效刻画投资者分歧,对股票未来收益具有显著的预测作用。

投资者分歧度越高,股票预期收益越低

Miller(1977)认为投资者分歧会造成股票价格过高,未来回报下降,原因是乐观投资者推高股价,而悲观投资者受到做空限制,对市场的影响力更弱。本文利用现有的多个深度学习因子,构建深度学习分歧度因子,验证了投资者分歧与股票未来收益的负相关性。样本空间为全 A 股,因子在 2017/1/4~2024/5/31 的回测期内周度 RankIC 均值为 6.06%,分 5 层 TOP 组合年化超额收益率为 9.75%,周频双边换手率为 117.70%。

树模型能够高效模拟投资者分歧

本文使用 50 个 LightGBM 模型来模拟投资者的预测观点。输入特征为股票截面特征,包含估值、成长、财务质量、量价、一致预期等类别,共 43 个。每个模型会随机选取 20 个特征进行训练,以模仿投资者接收差异化信息源。最后,计算所有模型对同一交易日同只股票的预测值的标准差,构建机器学习分歧度因子。因子在相同回测期内周度 RankIC 均值提升至 7.66%,分5层 TOP 组合年化超额收益率为 9.71%,周频双边换手率下降至 61.97%。

超参数选择对分歧度因子的影响基本不大

不同预测周期构建的分歧度因子回测表现接近,但预测周期越长,TOP 组合换手率越低,因为长线投资者的预测分歧在短期内变化不会太剧烈。不同投资者数量构建的分歧度因子回测表现差异不大,但投资者数量设置过少可能会造成 RankIC 偏低和换手率偏高。特征数量对分歧度因子的回测表现具有一定影响,随机选取的特征数量过多会导致投资者之间难以产生预测分歧。LightGBM、XGBoost 和 CatBoost 等不同机器学习模型构建的分歧度因子回测表现接近。

股票做空限制、动量和投资者认可度对分歧度因子具有显著影响

使用机构持股比例衡量个股的做空难易程度,机构持股比例低的股票池中分歧度因子多空表现更加显著,多空组合年化收益率从 32.89%提升至54.05%,说明做空限制是分歧度因子的坚实基础。近期涨幅最大的股票池中分歧度因子的多空组合年化收益率高达 63.04%,表明乐观投资者占据主导地位,观点分歧造成的买卖不对称性进一步增强。根据模型预测均值构建投资者认可度因子,发现一致看多的股票组合预期收益最高,“争议看空”的股票组合预期收益最低,分歧度与认可度因子等权合成的复合因子RankIC 和多头收益均有提升。

风险提示:借助机器学习构建的选股策略是历史经验的总结,存在失效的可能。机器学习存在过拟合的风险。本文回测暂未考虑交易费用。

免责声明:
您在阅读本内容或附件时,即表明您已事先接受以下“免责声明”之所载条款:
1、本文内容源于作者对于所获取数据的研究分析,本网站对这些信息的准确性和完整性不作任何保证,对由于该等问题产生的一切责任,本网站概不承担;阅读与私募基金相关内容前,请确认您符合私募基金合格投资者条件。
2、文件中所提供的信息尽可能保证可靠、准确和完整,但并不保证报告所述信息的准确性和完整性;亦不能作为投资决策的依据,不能作为道义的、责任的和法律的依据或者凭证。
3、对于本文以及文件中所提供信息所导致的任何直接的或者间接的投资盈亏后果不承担任何责任;本文以及文件发送对象仅限持有相关产品的客户使用,未经授权,请勿对该材料复制或传播。侵删!
4、所有阅读并从本文相关链接中下载文件的行为,均视为当事人无异议接受上述免责条款,并主动放弃所有与本文和文件中所有相关人员的一切追诉权。

0
好投学堂
第一时间获取行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「好投学堂」,或用手机扫描左方二维码,即可获得好投学堂每日精华内容推送和最优搜索体验,并参与编辑活动。

推荐阅读

0
0

评论

你来谈谈?
发表

联系我们

邮箱 :help@haotouxt.com
电话 :0592-5588692
地址 :福建省厦门市湖里区航空商务广场7号楼10F
好投学堂微信订阅号
扫一扫
关注好投学堂微信订阅号
Copyright © 2017-2024, All Rights Reserved 闽ICP备19018471号-6