开通VIP,畅享免费电子书等14项超值服
首页
好书
留言交流
下载APP
联系客服
导读:
摘要:
1.构造唯一指标衡量基金业绩: 由于基金经理这个“人”的因素存在,导致基金业绩评价比复杂,评价基金经理有很多维度、很多指标,有的维度用来衡量风格择时能力,有的指标用来衡量选股能力,有没有一个指标能够综合衡量基金经理的实力,只用这一个指标即可完成对其“真实力”的评价,并且这个指标不是务虚的,是能够根据其数值有效预测基金的未来收益? 这个指标是存在的,我们根据多年经验,参考大量文献,发现基于基金日频收益序列的多基金截面残差重抽样方法定义的“真实力”指标能够达到预测未来收益、优选基金的目标。这个话题我们曾经讨论过,再次讨论是因为模型在准确性和实用价值方面有重大改进。
2.指标构造的想法:alpha代表基金经理的超额收益,常被作为衡量投资能力的指标。该指标通过收益率序列和因子回归得来,有两个问题,一是估计问题,统计计算都有置信区间的说法,所以两个alpha数字相差不大的情况下,无法分出胜负,不能够为基金选择提供有价值的信息;第二个问题是,不同基金获得alpha的方式是不同的,获得alpha的时间段也可能不同,即便alpha大小相同,两个基金经理的能力也是不一样的。单从alpha这个单一指标来评价基金不妥当。
两个问题怎么解决?第一个讲的是统计估计问题,统计问题用统计学方法解决。历史区间当作一个样本,估计出一个数字,可能不准确,可以通过Bootstrap重抽样来解决,通过不断抽取不同的子区间,来获得多个样本,生成多个虚拟收益序列。第二个问题讲的是,不同基金经理获得alpha的时间段可能不同,有的基金经理把握了年初的成长行情,有的是把握了年末的周期行情,这种情况下,alpha数字相同,但这两个基金经理风格完全不同,放在一起比较不科学。所以,最好是基金经理每一天业绩都要和别的基金经理作比较,而且要选取每一天优秀的基金去跟他比,这是个金融问题,涉及到算法的构造,是本文的核心,我们在这里大概讲述了思路的起源。具体算法略复杂,见正文。
3.“真实力”指标效果良好:我们选普通股票型基金作为样本,考察每年前5%基金真实力指标与下一年收益率的关系:
金融预测本来就难,基金业绩预测由于基金经理这个“人”的因素影响,变得更难。评价基金经理有很多维度、很多指标,有的维度是用来衡量风格择时的能力,有的指标是用来衡量选股的能力,有没有一个指标能够综合衡量基金经理的实力?我们只用看这一个指标即可完成对其“真实力”的评价,而且这个指标不是务虚的,能够有效根据其数值预测基金未来收益?这个指标是存在的,我们根据多年经验,参考很多文献,发现基于日频基金净值的多基金截面残差重抽样方法定义的“真实力”指标能够达到预测未来收益、优选基金的目标。
关于基金经理“运气”与“实力”的讨论一直存在,最为著名的是2006年Kosowski, Timmermann, Wermers, Hal White关于基金经理运气实力的探讨。我们之前也写过有关的报告,这次再度讨论这个话题,一方面是因为Kosowski没有描述算法细节,我们之前领悟的算法有些不严谨;更重要是让模型的思想更加落地,更有实用价值。所以,本文也把代码和函数附上。由于理论模型运用到实际中,会有经验不足的问题,本文也结合客户近年来的反馈,细化解决模型使用中遇到的问题。
我们这里探讨的“运气”和“实力”,不是其字面意思。实力代表业绩的稳健性、可持续性;运气不代表过往业绩是真的是靠运气,只是认为那个业绩可能不可持续,这两个概念是从基金未来收益的角度来考虑的。运气的alpha不稳健,不容易持续,所以不适合选入FOF组合。这个模型的特点是,好的基金不一定能都能选出来,但选出来的基金在未来很可能业绩不错。
Alpha代表基金经理的超额收益情况,常被认为是衡量其投资能力的指标。但是我们都知道,该指标是通过收益率序列和因子回归得来的,其中有两个问题,一是估计问题,统计计算都有置信区间的说法,所以两个alpha数字相差不大的情况下,无法分出胜负,不能够为基金选择提供有价值信息;第二个问题是,不同基金获得alpha的方式是不同的,获得alpha的时间段也可能不同,所以即便alpha大小相同,两个基金经理的能力也是不一样的。综上,单从alpha这个单一指标来评价基金不妥当。
上面讲述alpha指标这两个问题,怎么解决?
(1)第一个讲的是统计估计问题,统计问题,用统计学方法来解决。把历史区间当作一个样本,估计出一个数字,可能不准确,这个问题可以通过Bootstrap重抽样来解决,通过不断地抽取不同的子区间,来获得多个样本,也就是生成多个虚拟收益序列。
(2)第二个问题讲的是,不同基金经理获得alpha的时间段可能不同,可能有的基金经理把握了年初的成长行情,有的是把握了年末的周期行情,这样的话,alpha数字相同,但是这两个基金经理风格完全不同,放在一起比较不科学。所以,最好是基金经理业绩每一天都要和别的基金经理作比较,而且要选取每一天优秀的基金去跟他比,这个是金融问题,涉及到算法的构造,是本文的核心,我们在这里大概讲述了思路的起源。具体算法下一节会介绍。
不管是基金的择股好还是择时好,都可以考察一个指标,就是每日的残差。选股好,股票在某个时间段大幅超越指数,那么基金在那个时间段的残差也是大的;择时好,基金在股票下跌之前卖出了股票,买入了安全资产,那么残差也是大的。所以,每日的残差在最细节处衡量了这个组合的收益行为。
业绩优秀的基金,一定是某日、某个时间段,有显著超越其它基金的残差,这部分不能够被因子解释,但确实是构成了超越其它基金的超额收益。这个行为稳健吗?这就是值得我们思考的问题。之所以探讨运气和实力,就是深挖基金的业绩构成,防止运气成分混杂其中,导致基金选择出现偏误。假如,某个基金经理,单个重仓股连续涨停多日,导致其alpha很高,这样的业绩我们认为存在不可复制的一面,存在运气成分。如同上文所说,我们说的运气,不代表该基金经理靠运气选的股票,只是说这样的业绩行为在未来不可持续,不适合未来配置该基金。
残差蕴含着“运气”和“实力”的重要信息,所以,我们需从残差中发现规律,构造有用的模型。基金收益高,可能是由于某些交易日残差过大这个运气成分带来的,基于此,可以构造虚拟收益率序列:
上面虚拟收益序列可以通过重抽样一千次,再对着因子回归,得到一千个alpha,称为运气alpha,是因为收益率序列的超额收益纯粹是由残差随机抽样带来的。如果某些交易日残差过大,会带来运气alpha的分布扁平,原先alpha如果偏小,落在置信区间左侧,更容易认为该基金的alpha是运气带来的。
上面是一个粗略板的模型。原因在于,构造运气alpha的分布,只用到了单个基金残差序列的信息,某些日期残差偏大,被重复抽样到了其它日期,所以构造有缺陷。更为完善的做法是利用横截面的信息来构造运气alpha分布。具体算法见下文。
在本文中,我们并非直接使用估计量进行检验,而是考虑其t统计量的估计量。原因体现在以下三点:(1)仅在绝对数值上衡量基金选股能力,而提供额外的置信区间信息。(2)t检验统计量通过用的方差估计值来标准化以纠正伪异常值。具体而言,对于成立时间较短或者高风险的基金,其alpha往往存在较高方差。因此在跨基金检验时,这些基金的容易被当作异常值处理。并且,这些基金往往规模较小,更易受到幸存者偏差的影响,导致跨基金alpha分布的极右尾部出现厚尾特征。(3)由于不同基金的风险水平及成立时间各异,导致alpha异常波动,标准差的分布比 的分布具有更好的统计性质。
本文将bootstrap 分析方法运用于Fama French五因子模型,对基金的选股能力进行分析。Fama French五因子模型利用基金的收益率和因子收益率的回归得到alpha,以衡量基金业绩。具体表示为:
其中,等式左边的r是基金i在t月的超额收益,即基金i的月度单位净值增长率减去无风险利率。右边的各个因子表示因子的收益率,分别为市场因子MKT、规模因子SMB (Small minus Big) 、估值因子HML (High minus Low BP)、盈利因子RMW (Robust minus Weak profit)、投资因子CMA (Conservative minus Aggressive inv) 。在构建不同因子的股票多空组合方法上,和Fama 原文相同,用不同因子的上50%分位的股票组合收益减去下50%分位组合的收益,得到多空组合下因子的收益数据。
得到相应的系数估计,以及残差估计的时间序列 ,以及alpha的t统计量 。
(4) 对新生成的,利用Fama French五因子模型进行回归,得到新的及。在步骤(3)的假设下,它们是服从均值为0 的正态分布。
利用以上1000组中大小排序相同的 ,(例如排序最高的t统计量:),可以生成这些 对应的分布函数 。这一步对不同排名(rank)的基金都给出了相应的参照分布。
至此,我们可以利用一支基金的 ,以及其对应的“运气”参照分布 ,来探究该基金的业绩表现究竟是因为“运气”还是因为基金经理“实力”。如果落入尾部,则拒绝运气,认为基金经理有实力。
在金融时间序列中,经常要对时间序列数据进行回归建模。时间序列数据通常具有异方差(Heteroscedasticity)和自相关(Autocorrelation)的性质,此时使用传统的最小二乘法(OLS)估计回归参数虽然仍可得到参数的无偏估计,但是传统方法计算出来的参数方差具有偏差,会导致参数的t检验不准确,常出现虚假显著的情况。而我们这个算法是基于t值的,方差有偏影响其准确性,为避免这种情况,计量经济学中常对上述参数的方差进行调整,最常用的是Newey-West方法。
我们需要多个基金构造横截面的分布,这多个基金如何选择,这是关系到模型有没有效的重大问题。首先从运气和实力问题本身出发,既然探讨运气实力,前提是这个基金业绩不差,而且待评价的基金业绩差不多,否则何来探讨“运气”“实力”?所以,我们这个算法,需要拿收益差不多的基金来计算的到横截面的运气分布。如果这组基金某个基金的收益很高,其它基金业绩一般,算出来的运气alpha一定是“瘦高”型,收益高的基金一定落到尾部,得出的评价是靠实力,从而计算错误。实际计算过程中,一定要注意样本基金的选择,要选和待评价基金收益差不多的基金作为样本。
上文说到实力运气的判断,并不利于我们模型的实际运用,最好有一个指标,这个指标越大越好,直接运用指标来选择基金。我们定义“真实力”指标:
真实力指标,是基金alpha的T值,减去这个基金对应运气分布99%分位数。
我们选普通股票型基金作为样本,考察其前5%基金真实力指标与下一年收益率的关系:
为了展示样本选择的重要性,我们分别计算了2020年前5%股票基金的IC系数,还有20%、50%的IC系数,前50%基金收益差距大,造成分布估计不准确,所以效果不好。实际运用这个模型,必须选择收益表现差不多的基金来计算。
我们知道统计推断的主体总是一个随机变量分布。当该分布很复杂、无法假设合理的模型参数时,bootstrap提供了一种非参数的推断方法,依靠的是对观测到的样本进行有放回的随机抽样,用生成的经验分布(empirical distribution)近似真正的分布。
本文之所以使用bootstrap方法对基金选股能力进行检验,主要出于以下两方面的原因:
由于大量数据表明单个基金业绩数据具有尖峰、厚尾及有偏的特征,并非正态分布,因此基于正态分布的统计推断可能存在较大的偏误。而在bootstrap 分析方法下,因无需对样本的分布进行正态假设,故能大大提高研究结果的准确度。
而基金业绩之所以不是正态分布主要出于以下几个原因。首先,基金内股票收益往往具有尖峰、有偏等特征,即并非正态分布,而基金经理在各支股票的仓位选取上也并非等额配置,所以我们也无法用中心极限定理去证明基金业绩的正态性。其次,市场基准收益也并非正态分布,它和股票的收益很有可能共偏。再者,各支股票收益时间序列自相关性程度不尽相同。最后,基金会根据市场风险以及自身业绩表现的变化,实时调节自身组合的风险水平。
各个基金的存续时长、风险水平不尽相同,这也导致跨基金的alpha分布并非简单的正态分布。不仅如此,对于某几支alpha表现突出的基金,若其残差中存在相似的隐含因子,那么它们的残差之间的相关性也不为零。这个因素很重要,因为高风险的基金往往都集中持有相似行业的股票,甚至是一样的股票。
基金alpha非正态分布也许意味着跨基金alpha非正态分布。但退一步讲,即使基金alpha是正态分布的,也存在跨基金alpha非正态分布的情况。
举例说明,假设我们有1000支在取样期内成立超过336个月的基金。每支基金的残差独立同分布,并且都服从标准正态分布。每支基金的alpha真实值为零。因此,我们可以通过336个月的残差均值来衡量每个基金的alpha。在这个例子中,跨基金alpha呈现正态分布。
然而,我们一旦放松对每支基金的残差分布假设,情况就会变得不一样,以下我们假设各基金的风险水平不同。(1)假设这1000支基金的残差的方差服从均匀分布 (方差均值仍然为1)。在这种情况下,跨基金alpha的分布会出现厚尾特征(相较正态分布)。也就是说,随着我们进一步向右移动,这些极端结果的概率不会很快下降,因为高风险基金相比低风险基金更可能带来高收益,所以其在尾部极端结果的概率较高。(2)假设风险水平的分布更为集中,即假设1%的基金残差标准差为4,剩余99%的标准差为0.92(方差均值仍然为1)。在这种情况下,跨基金alpha分布出现薄尾特征(相较正态分布)。在该情况下,大多数基金的风险水平较低,意味着这些基金的残差出现在跨基金alpha分布的远尾部的概率很低。由于仅存在少量高风险基金,在该分布在右尾部的某个点上开始快速下降,导致了薄尾的现象。(3)最后,假设高风险基金的比例高于(2)中的比例,即假设10%的基金残差标准差为2,剩余90%的标准差为0.82(方差均值仍然为1)。在这种情况下,相较正态分布,跨基金alpha的分布在5%及3%上分位数处更薄,在1%上分位数处更厚。总结来说,一旦各基金的风险水平存在异质性,那么不管单个基金收益的分布如何,跨基金alpha的分布会区别于正态分布,出现厚尾或薄尾现象。
有数据表明,基金之间的风险水平分布严重有偏。大多数基金风险水平相似,而极少一部分的基金则体现出高风险水平。而下文的实践检验也将体现跨基金alpha的分布有别于正态分布。因此,即使我们退一步,不考虑单个基金的alpha分布是否正态,基金风险水平的异质性也将导致跨基金alpha并非正态分布。
值得注意的是,当我们评估基金α的t统计量的分布时,类似的跨基金效应不会产生。即使不同基金的风险各异,但由于t统计量通过标准差已经进行了标准化,消除了不同风险的影响,所以这并不会引起t统计量的跨基金分布出现非正态的问题。然而,单个基金残差的非正态性仍然会导致跨基金t统计量呈现非正态分布。
因此,各个基金的成立时长(样本大小)、风险水平不同,并且基金收益残差存在厚尾及有偏性,以上这些原因都影响了跨基金alpha的分布形状。再加上参数估计时存在误差,这些因素之间相互作用,导致我们很难构造一个区别于正态分布的分布来评价alpha。而bootstrap 方法则通过构建跨基金alpha间的经验联合分布,很好地揭示了不同基金收益间的相关性及异方差性。
总结来说,绝大部分情况下我们只有使用bootstrap方法才能得出有意义的分析结果。因为如果想简单地使用传统的正态分布进行检验,只有当数据满足以下条件时才具有参考价值:(1)各基金收益的残差服从多元正态分布,(2)残差间的相关性为零,(3)各基金具有相同的风险水平,(4)不存在参数估计误差。而在现实情况中,要想满足以上所有条件几乎是不可能的。
风险提示:本报告结论完全基于公开的历史数据进行统计、测算,文中部分数据有一定滞后性,同时存在第三方数据提供不准确风险;模型均基于历史数据得到的统计结论且模型自身具有一定局限性并不能完全准确地刻画现实环境以及预测未来;模型根据历史规律总结,历史规律可能失效;模型结论基于统计工具得到,在极端情形下或存在解释力不足的风险,因此其结果仅做分析参考。
1、参考文献
[1] RobertKosowski & Allan Timmermann & Russ Wermers & Hal White, 2006. CanMutual Fund 'Stars' Really Pick Stocks? New Evidence from a BootstrapAnalysis. Journal of Finance, vol.61(6), pages 2551-2595, December.
[2] Efron, B.,and R.J. Tibshirani, 1993. An Introduction to the Bootstrap, Monographs on Statisticsand Applied Probability (Chapman and Hall, New York).