机器学习入门-问题处理流程
2015-08-06 13:56
120 查看
首先我们会得到相应背景下的问题,还有一些历史数据,接下来要思考的就是怎样利用数据学习算法解决问题?
目前了解到的问题解决过程,首先是数据探索,只有充分了解数据才能开展接下来的工作;结合业务背景和对数据的了解,我们需要对数据进行一些预处理;我们需要根据问题和我们设定的解决办法进行数据集的分割,得到训练数据和测试数据;利用数据学习算法我们可以得到问题的可能答案。
那么如果采用机器学习来解决问题,它的一般过程为:提出问题并收集数据,理解问题和分析数据得到提取特征方案,使用机器学习建模并得到预测模型。在机器学习中特征是重要的一环,特征是机器学习系统的原材料,对最终模型的影响是毋庸置疑的。特征的工作可以分为两步:特征设计,提取,优化;特征选择。在后面会针对特征选择加强学习。模型部分有可分为模型选择和模型融合。我们选用什么模型,模型的衡量标准,怎样得到最优模型,模型融合是否会有提升效果,都是我们要考虑的问题。
目前了解到的问题解决过程,首先是数据探索,只有充分了解数据才能开展接下来的工作;结合业务背景和对数据的了解,我们需要对数据进行一些预处理;我们需要根据问题和我们设定的解决办法进行数据集的分割,得到训练数据和测试数据;利用数据学习算法我们可以得到问题的可能答案。
那么如果采用机器学习来解决问题,它的一般过程为:提出问题并收集数据,理解问题和分析数据得到提取特征方案,使用机器学习建模并得到预测模型。在机器学习中特征是重要的一环,特征是机器学习系统的原材料,对最终模型的影响是毋庸置疑的。特征的工作可以分为两步:特征设计,提取,优化;特征选择。在后面会针对特征选择加强学习。模型部分有可分为模型选择和模型融合。我们选用什么模型,模型的衡量标准,怎样得到最优模型,模型融合是否会有提升效果,都是我们要考虑的问题。
相关文章推荐
- linux下tar.gz、tar、bz2、zip等解压缩、压缩命令小结
- POJ 1000 A+B Problem
- Zoho全球用户突破1500万-SaaS市场大有可为
- Reverse Integer
- bzoj-3757 苹果树
- POJ 3928 & HDU 2492 Ping pong(树阵评价倒数)
- 将博客搬至CSDN
- HDU 3966 RE 树链剖分 线段树 Aragorn's Story
- OGRE Material Script Sample
- varnish配置语法(应用)
- 基于PHP与Ajax的表单验证功能
- 查看iOS真机日志
- Linux下RPM软件包的安装及卸载
- 大讲台谈Hive常见的问题及解决方案(二)
- 高性能网络编程(1)—accept建立连接(转载,作者:陶辉)
- SQL复制表结构和数据
- 数组去重
- 堆栈的思考
- cocos 语法错误:“namespace”
- 外修语言 内修算法 加油啊