从零开始用人工智能预测股票(一、特征选取)
2018-03-19 15:32
218 查看
随着人工智能的崛起,越来越多的学科正在被人工智能改造,包括金融领域的很多分析决策工作。而神经网络是目前最火的人工智能技术,在我的理解中,神经网络适合处理拥有大量实践数据,数据内部存在某种关系的问题,正好股票的涨跌看起来符合这样的规律。
本教程是我自己摸索规律,学习使用算法和TensorFlow工具进行股票预测的记录,持续更新。
2、历史涨跌停数据(a股具有涨跌停特点,涨跌停时涨跌幅并不能完全反应当天市场动能,可做特殊标注)
2、股市指数(股市总体的热度,包括指数,成交量,开户数等)
2、板块百度指数
3、概念百度指数
4、自身媒体指数
股票历史数据来源为聚数力(http://www.dataju.cn/Dataju/web/home),网站有机器学习常用的一些数据,有需要的同学可以自行查找。
百度指数经过一段时间的研究,无法直接提取。可行的来源有两种:一是淘宝上有按关键字卖的百度指数,需要花钱买;二是用python+机器学习进行爬取,模拟登陆,输入关键字,截图并截取数据图块,平移鼠标再次截取图块,然后对数据图块进行图像识别。第二种方法研究到截取图块时一直无法定位准确,暂时搁置。
其他数据暂时没有更好的来源,如果大家有好的数据来源,欢迎留言讨论。
综上选取聚数力平台的股票历史数据作为数据集,探索机器学习在股票预测方面的应用。
本教程是我自己摸索规律,学习使用算法和TensorFlow工具进行股票预测的记录,持续更新。
1、特征选取
为了用神经网络模拟大量数据中存在的某些关系,首先需要选取可能对结果产生影响的特征。经过我不成熟的思考,我认为可能有以下一些方面:a、历史数据影响因子:
1、自身历史数据(这个很好理解,之前的数据会对之后的数据走势产生影响)2、历史涨跌停数据(a股具有涨跌停特点,涨跌停时涨跌幅并不能完全反应当天市场动能,可做特殊标注)
b、大环境
1、经济指数(经济大环境会对股票走势产生影响)2、股市指数(股市总体的热度,包括指数,成交量,开户数等)
c、热度
1、自身百度指数(百度指数反应股票在社会中的影响力大小)2、板块百度指数
3、概念百度指数
4、自身媒体指数
d、庄家
1、换手率(成交量、换手率等可以反应大量交易的数据)e、周五周一假期影响
周五至周一中如有重大消息或新闻爆出,则会对股票走势产生较大影响2、获取数据
以上数据要全部获取难度不小,为了不影响进度,我仅采用股票历史数据做以模拟,其他特征数据待以后完善。股票历史数据来源为聚数力(http://www.dataju.cn/Dataju/web/home),网站有机器学习常用的一些数据,有需要的同学可以自行查找。
百度指数经过一段时间的研究,无法直接提取。可行的来源有两种:一是淘宝上有按关键字卖的百度指数,需要花钱买;二是用python+机器学习进行爬取,模拟登陆,输入关键字,截图并截取数据图块,平移鼠标再次截取图块,然后对数据图块进行图像识别。第二种方法研究到截取图块时一直无法定位准确,暂时搁置。
其他数据暂时没有更好的来源,如果大家有好的数据来源,欢迎留言讨论。
综上选取聚数力平台的股票历史数据作为数据集,探索机器学习在股票预测方面的应用。
相关文章推荐
- 从零开始用人工智能预测股票(二、数据加工)
- 从零开始用人工智能预测股票(三、初步实现)
- 来学学数据分析吧(二)第一章 预测和关联数量特征
- 自动预测保险理赔:机器学习之特征预处理(Kaggle保险索赔竞赛案例)
- 股票涨跌预测方法之一:下载股票数据
- 从零开始在iPhone上运行视频流实时预测模型应用,只需10步
- 从零开始学JAVA WEB(2)——项目选取
- 解析大乐透,预测股票信息入库
- 2018年人工智能13大预测
- 论文阅读笔记之ICML2012::The Landmark Selection Method for Multiple Output Prediction 基于代表性特征选取的多维度回归方法
- 一文教你如何用Python预测股票价格
- 昨天写了利用时间序列搜索方法预测股票价格程序
- 一文教你如何用Python预测股票价格,程序员学以致用
- Tensorflow实例:利用LSTM预测股票每日最高价(二)
- 股票价格预测
- SVM:SVM之Classification根据已有大量数据集案例,输入已有病例的特征向量实现乳腺癌诊断高准确率预测—Jason niu
- 可以预测女朋友什么时候会生气的人工智能
- 数据挖掘在股票预测中的应用
- 从零开始玩人工智能—人脸 API
- 从零开始-Machine Learning学习笔记(3)-线性回归中的特征缩放与正规方程