葡京集团app下载

English  |   学校主页  |   收藏本站

“业界讲坛”第七十六讲

---回归分析在股票收益预测中的应用

 

2020630日,海通证券研究所的金融工程首席分析师冯佳睿老师应邀来葡京集团app下载讲授以 “回归分析在股票收益预测中的应用”为主题的业界论坛。冯佳睿毕业于复旦大学概率论与数理统计专业。2010年他加入海通证券研究所,主要从事大类资产配置和多因子选股的研究。2013-2019年,连续7年上榜新财富最佳分析师评选。

 

 


首先,冯佳睿老师为我们介绍了回归分析的参数估计在股票收益预测中的应用。通常我们在选股时,会考虑因子的风格——规模及价值,收益率、波动率、分析师覆盖率及行业轮动因子等,最终我们的目标变量就是“预期收益”。在回归模型中,回归的因变量是所有个股t月的收益率,自变量为个股t-1月末的因子值,回归系数即为因子t月的因子溢价。我们最终利用估计的因子溢价这个系数来预测下一个月的股票收益。因此关键在于确定回归系数因子溢价。由于每个月都可以得到一个因子溢价系数,因此通常会采用t-12+1t月的因子溢价的均值估计。但当因子溢价的变化较大时,我们认为简单的加权平均会有偏差。此时我们可以调整权重系数从而调整最新的因子溢价与历史因子溢价在最终用于预测的因子溢价中的占比大小。在统计检验中,我们将因子划分为收益因子与风险因子。能够在横截面上解释股票收益波动的因子可以视为风险因子;在时间序列上溢价稳健且具有可靠的经济学逻辑的风险因子可以视作收益因子。在最后的模型评价环节,我们利用预测值与实际值的相关系数——IC来评价模型优劣,一般来说IC20%时模型效果就可以认为不错。

 

 


随后,冯老师为我们介绍了回归诊断在股票收益预测中的应用。在这里,我们需要检验指标因子与收益之间是否具备可靠的线性关系。首先我们对股票的对数总市值采取横截面标准化,得到市值Z-score;当z分别取正及负,我们再分别计算出拟合的直线斜率值。这里需要注意的是,对于市值特别大或者特别小的股票,如果只用一条回归曲线会导致预测有较大的偏差(即非完全线性)。此时可以考虑用非线性拟合。而我们在拟合后,需要画出残差图,观察其是否符合随机误差的分布图。若有显著异常则需要对因子进行改进。比如加入因子的平方项等非线性因子进行下一步拟合。并在回归时给出该非线性因子的参数检验结果,从而确定因子是否显著。

 


接下来冯佳睿老师为我们介绍了机器学习在股票收益预测中的应用。当行业出现冲击时,投资者无法非常迅速作出即时反应,会有一定的滞后效应,并且回归分析的应用难点在于自变量过多容易过拟合,因此考虑用机器学习进行特征的选择,例如post-lasso.选择后的统计推断。首先通过lasso筛选出系数非零的变量的回归系数值,然后用这些特征重新训练一个最小二乘回归,但通过lasso进行特征选择这一方法是否具备经济学逻辑待验证。紧接着冯老师为同学们讲解了一个Lasso进行特征选择的实例。例子中银行总共被选中的次数在所有行业中位列前5,而银行本身是重要的金融中介机构,说明lasso的系数选择有一定效果。而有的变量lasso回归系数不显著,即滞后预测的能力较低,若最终选中0个变量,可以有两种方法来处理:第一种是不处理,即用回归模型的截距项;第二种是用动量的均值来代替。然后冯老师为同学们介绍了超参数的敏感性分析,即训练期长度及动量法所采用的时长这两个参数需要通过调整使得最终得到的模型系数较为稳健。

接下来冯佳睿老师简单介绍了深度学习的应用,即使用LSTM模型预测股票下一个交易日的涨跌,但预测效果一般。最后冯佳睿老师总结说,回归分析仍然是股票收益预测应用最广泛的一类方法,线性模型很简单,易于理解,效果不差,仍有细化的空间。机器学习很灵活,若善加利用会有很大的发挥空间。深度学习很强大,但解释能力及预测能力等有待进一步改善。

 

 


在提问环节,同学们踊跃向冯老师提问。有同学问到主成分分析实际应用的问题,冯老师进行了详细的解答。冯老师表示使用主成分分析法不利于模型的解释。还有同学提问关于金融工程中对模型解释能力和预测准确性的选择问题,冯老师也进行了耐心的解答。

本次业界论坛讲座,冯佳睿老师对回归分析、机器学习和深度学习在股票收益预测中的应用进行了讲解,同学们收获颇丰,对业界关于股票收益预测的方法有了更多的认识与了解。

 

供稿人:成源远

供图人:伍豪

 


'); })();