一种基于AdaBoost算法进行股票短期预测方法与流程

未命名 10-08 阅读:112 评论:0

一种基于adaboost算法进行股票短期预测方法
技术领域
1.本发明涉及金融数据挖掘技术领域,尤其涉及一种基于adaboost算法进行股票短期预测方法。


背景技术:

2.股票投资已经成为人们生活中的重要组成部分,有效地进行股票价格预测,最大程度规避股票风险,增加投资收益,是股票投资者最关注的热点问题。因此股市预测方法的研究具有极其重要的应用价值和理论意义。
3.目前,股票的短期波动和择时面临如何筛选有效因子的问题,对于因子的筛选又有很多种形式,已经pca的,基尼系数的等,因子的筛选有很多主观的因素在里面,需要人工处理,从而导致工作效率降低。


技术实现要素:

4.本发明的目的在于提供一种基于adaboost算法进行股票短期预测方法,旨在解决传统的预测方法工作效率较低的问题。
5.为实现上述目的,本发明提供了一种基于adaboost算法进行股票短期预测方法,包括以下步骤:
6.建立历史数据集;
7.基于所述历史数据对学习器进行训练,得到预测模型;
8.使用所述预测模型对股票进行预测,得到预测数据。
9.其中,所述建立历史数据集,包括:
10.获取历史数据;
11.基于所述历史数据建立历史数据集。
12.其中,所述基于所述历史数据对学习器进行训练,得到预测模型,包括:
13.对所述历史数据集进行预处理,得到训练数据集;
14.基于所述训练数据集对学习器进行训练,得到预测模型。
15.其中,所述预测模型的训练方式为随机数据迭代训练。
16.其中,所述历史数据的预处理方式为归一化处理。
17.本发明的一种基于adaboost算法进行股票短期预测方法,建立历史数据集,基于所述历史数据对学习器进行训练,得到预测模型,使用所述预测模型对股票进行预测,得到预测数据,从tushare网站上面取历史2年数据作为基础数据,基于基础数对学习器进行训练得到所述预测模型,通过预测模型对股票进行预测,得到预测数据,本发明的所述预测模型纯多头的年化收益率接近15%,远远高于简单持有指数获得的8%的年化收益率,且具有比较高的鲁棒性,通过所述预测模型对股票进行预测提高工作效率,从而解决了传统的预测方法工作效率较低的问题。
附图说明
18.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
19.图1是本发明提供的一种基于adaboost算法进行股票短期预测方法的流程图。
20.图2是预测模型训练图。
具体实施方式
21.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
22.请参阅图1至图2,本发明提供一种基于adaboost算法进行股票短期预测方法,包括以下步骤:
23.s1建立历史数据集;
24.s11获取历史数据;
25.具体的,从tushare网站上面取历史2年数据作为基础数据。
26.s12基于所述历史数据建立历史数据集。
27.具体的,取后半年数据作为验证集,前一年半数据作为训练集进行训练。
28.s2基于所述历史数据对学习器进行训练,得到预测模型;
29.s21对所述历史数据集进行预处理,得到训练数据集;
30.所述历史数据的预处理方式为归一化处理。
31.具体的,引入预处理过程,对于所有的变量需要做归一化处理,把最大最小值去掉,以免影响结果,最终把把因子的值变成0到1区间的值。
32.s22基于所述训练数据集对学习器进行训练,得到预测模型
33.所述预测模型的训练方式为随机数据迭代训练。
34.具体的,对每个弱分类器使用深度为5的决策树进行训练,adaboost是一种集成学习模型,其模型训练过程如图示1,其特点是自动做特征筛选
35.基于多个弱分类器构建一个强分类器,它的自适应性体现在当前基分类器分类错误的样本权重会增大,而正确分类的样本权重会减小,从而在训练下一个基分类器时会着重拟合之前分类错误的样本。
36.具体的算法实现逻辑:
37.输入训练数据集
38.t={(x1,y1),(x2,y2),

(xn,yn)},y∈{-1,+1},
39.t代表训练的所有的数据,x代表训练数据,y代表涨跌
40.基学习器gm(x),训练论述m;
41.1、初始化权值分布:
[0042][0043]
w代表权重,默认值为1/样本个数
[0044]
2.for m=1to m
[0045]
(a)使用带有权值分布的训练集学习的到基学习器$g_m(x)$
[0046][0047]
gm代表分类起算法
[0048]
(b)计算gm(x)在训练集上的误差率:
[0049][0050]
代表训练数据集上的分类误差率,分错的类别的总数乘以权重
[0051]
(c)计算gm(x)的系数:
[0052][0053]
根据误差反向更新每个训练器的系数
[0054]
(d)更新样本权重分布:
[0055][0056]
对于每个样本更新对应的权重其中zm是规范化因子
[0057]
其中z
(m)
是规范化因子,
[0058][0059]
规范因子用于平滑weight的更新值
[0060]
以确保所有的构成一个分布。
[0061]
输出最终模型:
[0062][0063]
m个分类器的集合
[0064]
对于adaboost的改进方案
[0065]
引入预处理过程,对于所有的变量需要做归一化处理,把最大最小值去掉,以免影响结果,最终把把因子的值变成0到1区间的值
[0066]
通过psi(特征相关性),去掉相关性比较大的特征
[0067]
由于股票行业的特殊性,有些因子的效果比较明显,在更新权重d环节,认为引入权重系数,加入人工经验,对于比较重要的因子适当的增加权重值,在进去下一轮迭代。
[0068]
s3使用所述预测模型对股票进行预测,得到预测数据。
[0069]
具体的,对应到股票短期预测的场景,取沪深300的日级别数据,因子库从alpha101短期高频量价因子中的有效因子,加上股票的基本面因子
[0070]
使用的因子列表如下:
[0071][0072]
以上所揭露的仅为本发明一种基于adaboost算法进行股票短期预测方法较佳实
施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

技术特征:
1.一种基于adaboost算法进行股票短期预测方法,其特征在于,包括以下步骤:建立历史数据集;基于所述历史数据对学习器进行训练,得到预测模型;使用所述预测模型对股票进行预测,得到预测数据。2.如权利要求1所述的一种基于adaboost算法进行股票短期预测方法,其特征在于,所述建立历史数据集,包括:获取历史数据;基于所述历史数据建立历史数据集。3.如权利要求2所述的一种基于adaboost算法进行股票短期预测方法,其特征在于,所述基于所述历史数据对学习器进行训练,得到预测模型,包括:对所述历史数据集进行预处理,得到训练数据集;基于所述训练数据集对学习器进行训练,得到预测模型。4.如权利要求3所述的一种基于adaboost算法进行股票短期预测方法,其特征在于,所述预测模型的训练方式为随机数据迭代训练。5.如权利要求4所述的一种基于adaboost算法进行股票短期预测方法,其特征在于,所述历史数据的预处理方式为归一化处理。

技术总结
本发明涉及金融数据挖掘技术领域,具体涉及一种基于AdaBoost算法进行股票短期预测方法,包括以下步骤:建立历史数据集,基于历史数据对学习器进行训练,得到预测模型,使用预测模型对股票进行预测,得到预测数据。本发明通过从tushare网站上面取历史2年数据作为基础数据,基于基础数对学习器进行训练得到预测模型,通过预测模型对股票进行预测,得到预测数据,预测模型纯多头的年化收益率接近15%,远远高于简单持有指数获得的8%的年化收益率,且具有比较高的鲁棒性,通过预测模型对股票进行预测提高工作效率,从而解决了传统的预测方法工作效率较低的问题。法工作效率较低的问题。法工作效率较低的问题。


技术研发人员:胡凯祺
受保护的技术使用者:杭州顶点财经网络传媒有限公司
技术研发日:2023.07.05
技术公布日:2023/10/6
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐