您的位置:首页 > 其它

机器学习入门-问题处理流程

2015-08-06 13:56 120 查看
首先我们会得到相应背景下的问题,还有一些历史数据,接下来要思考的就是怎样利用数据学习算法解决问题?

目前了解到的问题解决过程,首先是数据探索,只有充分了解数据才能开展接下来的工作;结合业务背景和对数据的了解,我们需要对数据进行一些预处理;我们需要根据问题和我们设定的解决办法进行数据集的分割,得到训练数据和测试数据;利用数据学习算法我们可以得到问题的可能答案。

那么如果采用机器学习来解决问题,它的一般过程为:提出问题并收集数据,理解问题和分析数据得到提取特征方案,使用机器学习建模并得到预测模型。在机器学习中特征是重要的一环,特征是机器学习系统的原材料,对最终模型的影响是毋庸置疑的。特征的工作可以分为两步:特征设计,提取,优化;特征选择。在后面会针对特征选择加强学习。模型部分有可分为模型选择和模型融合。我们选用什么模型,模型的衡量标准,怎样得到最优模型,模型融合是否会有提升效果,都是我们要考虑的问题。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: