(原标题:谨防量化基金的过度归纳)
陈嘉禾 九圜青泉科技首席投资官
本文原载于《证券时报》
由于量化基金往往涉及到大量计算和数学知识,所以不少投资者对这类基金并不算熟知,一听说量化基金使用多少计算机进行人工智能计算、在多少毫秒之内能进行多少次自动交易决策,再配上短期亮眼的业绩,不少人就会觉得量化投资特别高级。相比之下,那些只会用Excel表计算的主动基金经理、或者连Excel表都不怎么用的沃伦﹒巴菲特,就显得土气了许多。
殊不知,量化投资也只是投资手段的一种,也是机器在人的指导下做出的投资决策。因此,主动投资里会由人主观偏差所犯下的错误,在量化投资中一样存在。而在量化投资容易犯下的各种错误中,“过度归纳”就是一种尤其需要重视的问题。
所谓“过度归纳”,指的就是量化基金在用数量化的方法寻找市场规律时,进行了过度的优化和归纳,过于依赖一种市场逻辑、或者一种量化策略、或者一类策略参数。
由于这种“过度归纳”导致量化基金非常依赖在过去一小段时间里有效的归纳规律,因此当这种市场规律仍然有效时,量化基金会取得非常良好的短期业绩。但是,也正是由于这种投资方法过于集中在一种市场规律和归纳结论上,因此一旦这种市场规律发生扭转,量化基金往往会遭遇迅速而突然的损失,让只看过去一两年的业绩、就轻率选择基金产品的投资者猝不及防。
其实,对于量化基金来说,由于量化投资手段可以在无数的规律、策略、参数中进行选择,因此很容易发现一两种在过去非常有效的规律组合。但是,这种组合很可能是“过度归纳”的结果,而这种组合的运用,有两种典型的情况,会对投资者产生误导。
第一种情况,是用一个“过度归纳”的量化研究结果,对投资者进行宣传,宣称自己的量化投资策略在过去取得了如何优异的投资成果。这里,让我们用一个例子,来看这种“过度归纳”的历史研究,是怎样可能杜撰出一个实际很难取得的研究结果的。
假设有一个量化研究,使用某种量化策略,对市场历史数据进行回测。假设这个策略使用了3个参数,每个参数从1到100可以选择100个值,那么这个量化研究就会得到100的3次方、也就是1000,000个值。如果这个量化研究在这1000,000个组合中,挑出最好的的1个组合,然后宣称这是这个策略在过去10年中可能取得的投资回报,那么这种宣传说错了吗?
量化研究的发布者可以说,自己并没有错,这个结果确实是这个量化策略在过去可能取得的业绩。只不过,这是1/1000,000分之一的结果,而且是最好的那个结果。那么,这个结果在未来果真的靠得住吗?答案不言而喻。
第二种情况,则是量化基金选择了过去一段时间最优的策略和参数,把大部分的仓位都压在这个策略和参数上。在这种情况下,由于市场趋势一般都会持续一段时间,因此,这么做的量化基金,有很大的概率会在未来一段时间里表现得不错。
但是,这种依靠“过度归纳”的量化投资方法,做错了什么呢?由于市场的风格并不会永远不变,因此过于押宝少量甚至单一策略、参数的量化基金,在市场风格一旦转变的时候,会突然从盈利转为亏损。而由于仓位压得过重、投资策略过于集中,这种转变也会变得特别的快。
那么,正确的量化基金投资策略应该是怎样的呢?量化基金需要做的,不光是思考如何获得收益,也需要思考一旦投资风格转变、一旦过去的量化策略和参数失效,如何最大程度的避免风险。
因此,对于成熟稳重的量化基金来说,它们需要把自己的投资仓位分散在不同的投资策略、量化参数上。这样做会让量化基金在市场风格非常极致的时候,难以赚到最多的钱,但是也会让它们在这种极致风格发生逆转的时候,能够更好的度过难关。
在历史上,一些量化基金由于进行了“过度归纳”的投资,从而在市场风格持续演绎时盈利高涨、市场风格一旦转变时就“扭盈为亏”、甚至亏损惨重的情况,并不少见。
早在2014年的A股市场,由于当年前大半年的时间里,市场呈现一种“低估值蓝筹股下跌、高估值小公司上涨”的市场格局,因此一些不太重视“过度归纳问题”的量化基金,很容易就发现这其中的市场机会:只要做多高估值的小公司股票、做空低估值的蓝筹股,就可以简单的赚到钱。
问题是,由于蓝筹股的盈利能力往往比小公司更强(在全球范围内多半如此,在中国市场大多数时候也不例外),因此这种“过度归纳出来的量化投资策略”,其实是有很大问题的:它做多了价值更少的股票、做空了价值更多的股票。
任何违背长期价值的市场状态,都注定了难以永久维持,2014年的市场行情也是一样。到了2014年的11月20日,市场风格突然大转,代表蓝筹股的上证50指数从11月20日的1,676点,在一个半月的时间里,就上涨到了2015年1月5日的2,649点,涨幅58%。而同期代表小股票的中证500指数,则仅从4,974点上涨到了5417点,涨幅仅有9%。
结果,不少之前依靠“做多小盘股、做空蓝筹股策略”的量化基金,在短短一个多月时间里,录得大幅亏损,让投资者始料不及。
有道是“历史不会简单重演,但是常常会押韵。”到了2021年,类似的事情又开始上演。由于在2019年到2021年上半年的将近两年的时间里,A股市场上低估值的股票表现不佳,而估值高的股票则一再上涨,因此市场上开始有了“买股票就是要买贵的”、“怕高才是苦命人”的说法。
而这样一个显而易见的市场结构性规律,自然逃不过计算迅速的量化基金的眼睛。于是,在量化投资界,一种类似于当年“做多小盘股、做空蓝筹股”的、过度归纳的投资策略,再次开始出现,只不过这次变成了“做多高估值股票、做空低估值股票”。但是,这种策略虽然顺应了短期的市场潮流,在长期却是显然违背了投资和商业规律的。在长期,它给过度依赖这种策略的量化基金带来的危害,也是显而易见的。
其实,对于投资于量化基金的投资者来说,最应该避免的一种判断方法,就是只根据基金的中短期业绩进行判断,而不仔细深究这个业绩是如何取得的。而对于主动投资基金,事情也是一样,那些只顾短期业绩好、不管短期业绩如何取得的投资者,往往很难取得长期让人满意的结果。
毕竟,量化投资不过是数量化的主动投资,本质上仍然是由人做出决策,只不过量化投资依赖的工具是数据模型,主动投资依赖的工具是主观经验而已。
不仅国内的量化投资策略会出现“过度归纳”的问题,海外成熟市场的基金,有时候也会出现同样的问题:甚至有过之而不及。
在美国证券市场,曾经名噪一时的长期资产管理公司(Long-Term Capital Management)、不凋花咨询公司(Amaranth Advisors)这两家著名的基金公司的倒闭,就是来自于当时“过度归纳”带来的巨大风险。这两家基金公司虽然不属于纯粹的量化基金,但是他们在投资中应用了大量数学模型和公式,可以在一定程度上被看作是“准量化基金”。但是,当犯下了“过度归纳”的错误时,再多的数量化模型也没有能够帮助到它们:甚至让它们的失败来得更加惨烈。
在量化基金没有注意“过度归纳”的风险、从而可能产生的问题中,有两个额外的知识点,是投资者需要格外留神注意的。
其一,是在短期市场中,量化基金如果不重视“过度归纳”可能带来的风险,往往反而可能由于全仓压上单一量化策略和量化参数,从而取得短期内非常好、甚至远超同行的业绩。而在追逐短期业绩的市场中,这种业绩又可能会带来巨大的规模增加。
其二,正是这种“优秀的短期业绩带来短期规模暴增”的现象,回过头来又会在市场风格突然转向时,由其巨大的规模造成市场风格变化的更为加剧。也就是说,当市场风格转向时,如果大量原来押注在这个风格上的资金,都试图在短期完成调仓,那么如此巨大的交易量,会让市场风格变得更加极端,也让之前没有重视风险的量化基金,从盈利到亏损的速度变得更加迅速。
所以,正如《列子》所云,“圣人不查存亡,而察其所以然。”投资者在投资量化基金时,绝不可以只看量化基金几年的、中短期的业绩好坏,而忘记考察量化基金是究竟如何取得了如此业绩的。只有“知其表又知其里,知其外又知其内”,才能做出长期优秀而稳健的投资决策。