学习笔记(02):零基础搞定Python数据分析与挖掘-数据分析的流程
2020-04-22 00:44
615 查看
立即学习:https://edu.csdn.net/course/play/6861/326736?utm_source=blogtoedu
SEMMA Circle:
1)S: sample, 常用手段:问卷调查,数据库查询,实验室试验,仪器设备的记录
2)E: explore, 常用探索方向:离散变量的分布比例,连续变量的分布形态,数据的异常和缺失,特征选择
3)M:modify(数据修正) 常用修正方法:数据类型的转换,数据的一致性处理,异常值和缺失值的处理,数据形态的转换
4)M:model,侧重于对未知事件的预测:
supervised predictive: regression, decision tree, KNN,
supervised classification: logistic, 贝叶斯,集成算法,
unsupervised model:k-means聚类,层次聚类,密度聚类
半监督:关联规则
5)A:access 检验model的稳定性和实用性,常用检验方法: RMSE(均方误差,对于预测性),混淆矩阵,ROC曲线,KS曲线
度量和预测现有数据:
增加样本
扩展维度
修正模型参数-修正
更换其他模型-集成模型
- 点赞
- 收藏
- 分享
- 文章举报
相关文章推荐
- 学习笔记(08):零基础搞定Python数据分析与挖掘-字符串的常用方法
- 学习笔记(03):零基础搞定Python数据分析与挖掘-数据分析与挖掘的区别
- 学习笔记(04):零基础搞定Python数据分析与挖掘-需要掌握的技能
- 学习笔记(01):零基础搞定Python数据分析与挖掘-自定义函数的介绍与使用(一)...
- python数据分析与挖掘学习笔记(1)-基础及准备
- 学习笔记(02):Python数据殿堂:数据分析与数据可视化-概述,数据类型,数组基础...
- 学习笔记(02):Python数据殿堂:数据分析与数据可视化-概述,数据类型,数组基础...
- Python数据分析与挖掘实战学习笔记
- python数据分析与挖掘学习笔记(7)-交通路标自动识别实战与神经网络算法
- python数据挖掘学习笔记】十三.WordCloud词云配置过程及词频分析
- Python数据分析与挖掘实战学习笔记(一)
- python数据分析与挖掘学习笔记(2)-淘宝商品数据清洗及预处理
- Python玩转数据分析学习笔记-01基础
- 学习笔记(03):Python数据分析与爬虫-Python中的流程控制语句:if条件判断
- Python数据分析与挖掘实战学习笔记(二)
- Python数据分析与挖掘学习笔记一:库和环境搭建
- william的python数据分析与挖掘学习总结一:python入门基础知识
- python数据分析与挖掘学习笔记(3)_小说文本数据挖掘part1
- 学习笔记(02):Python数据分析与爬虫-5种常用运算符:逻辑运算符和成员运算符
- Python数据挖掘学习笔记】九.回归模型LinearRegression简单分析氧化物数据