(原标题:如何比较十年来的股票和基金?)
前几次我们讨论了用通达信和果仁网,今天我们用choice这个平台来比较股票和基金的长期表现。
进入choice后找到股票数据浏览器,在左下角找到“全部A股“,在”待选指标“中选择”年收盘价“,选择从2011年开始一直到2022年9月30日,复权方式选择”后复权。在“证券资料”中选择“首发上市日期“和”摘牌日期”,保存模板,并导出excel表。
这个表还不能直接用,需要做一步“清洗数据”的工作。以这个表为例,有很多多余的数据,比如不知道什么原因把一部分2和9开头的B股也导出了,另外还有一部分8开头的新三板股票,这些都必须删除。
在后复权价格中,也有一部分错误的数据,比如说首发上市日期前的后复权价格,和摘牌日期后的后复权价格,都不是在股票的生命期中的价格,也必须剔除。
部分平台没经过仔细校验,输入的数据是错误的,不管你计算的如何正确,得到的结果肯定是错误的,所以对我们来说,手工校验并尽可能的把错误的数据洗干净,是一个数据工作者的必修课。
然后建立一个新的“收益率”的sheet,计算每只股票每年的收益率,公式很简单=当年后复权价/前一年后复权价格-1,但必须剔除这两个价格是空白的情况,细节决定成败。
然后计算上表的数据,以2012年为例, 大于0数量:=COUNTIFS(收益率!C:C,>0) 小于0数量:=COUNTIFS(收益率!C:C,<0) 等于0数量:=COUNTIFS(收益率!C:C,=0) 总数:=SUM(B2:B4) 胜率:=B2/B5 平均:=AVERAGE(收益率!C:C) 中位数:=MEDIAN(收益率!C:C) 然后把2012年这一列的数据复制到2013-2022年(截止到2022年9月30日)
用类似的方法,我们得到了上面的混合基金的这张表。
然后我们比较一下这10年多来股票和混合基金的表现。先看胜率,从2012年到2021年这10年,混合基金的胜率相比股票,最少高4.34%,最多高63.29%,平均高22.94%,唯一混合基金胜率跑输股票的是2022年截止到9月30日,跑输了11.61%。
再看算术平均,11年里7年混合基金跑赢股票,4年跑输;中位数也是7年跑赢4年跑输。整体来看还是混合基金跑赢了股票。
今天这个例子是想说明清洗数据的重要性和边界条件的重要性,找出bug的方法都是从原始数据入手找到个案的错误,然后全面的举一反三的去修正它。培养这种能力是很重要的,不加分辨的直接用数据很有可能存在bug。
昨天开始外盘强烈反弹,今天恒生指数暴涨5.90%。都说会先涨后跌,我们耐心等待吧。