您的位置:首页 > 大数据 > 人工智能

从零开始用人工智能预测股票(一、特征选取)

2018-03-19 15:32 218 查看
随着人工智能的崛起,越来越多的学科正在被人工智能改造,包括金融领域的很多分析决策工作。而神经网络是目前最火的人工智能技术,在我的理解中,神经网络适合处理拥有大量实践数据,数据内部存在某种关系的问题,正好股票的涨跌看起来符合这样的规律。

本教程是我自己摸索规律,学习使用算法和TensorFlow工具进行股票预测的记录,持续更新。

1、特征选取

为了用神经网络模拟大量数据中存在的某些关系,首先需要选取可能对结果产生影响的特征。经过我不成熟的思考,我认为可能有以下一些方面:

a、历史数据影响因子:

1、自身历史数据(这个很好理解,之前的数据会对之后的数据走势产生影响)
2、历史涨跌停数据(a股具有涨跌停特点,涨跌停时涨跌幅并不能完全反应当天市场动能,可做特殊标注)

b、大环境

1、经济指数(经济大环境会对股票走势产生影响)
2、股市指数(股市总体的热度,包括指数,成交量,开户数等)

c、热度

1、自身百度指数(百度指数反应股票在社会中的影响力大小)
2、板块百度指数
3、概念百度指数
        4、自身媒体指数

d、庄家

1、换手率(成交量、换手率等可以反应大量交易的数据)

e、周五周一假期影响

周五至周一中如有重大消息或新闻爆出,则会对股票走势产生较大影响

2、获取数据

以上数据要全部获取难度不小,为了不影响进度,我仅采用股票历史数据做以模拟,其他特征数据待以后完善。
股票历史数据来源为聚数力(http://www.dataju.cn/Dataju/web/home),网站有机器学习常用的一些数据,有需要的同学可以自行查找。
百度指数经过一段时间的研究,无法直接提取。可行的来源有两种:一是淘宝上有按关键字卖的百度指数,需要花钱买;二是用python+机器学习进行爬取,模拟登陆,输入关键字,截图并截取数据图块,平移鼠标再次截取图块,然后对数据图块进行图像识别。第二种方法研究到截取图块时一直无法定位准确,暂时搁置。
其他数据暂时没有更好的来源,如果大家有好的数据来源,欢迎留言讨论。

综上选取聚数力平台的股票历史数据作为数据集,探索机器学习在股票预测方面的应用。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息