ML之Classification:以六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类预测案例来理解和认知机器学习分类预测的模板流程
2020-09-01 20:27
3143 查看
ML之Classification:以六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类预测案例来理解和认知机器学习分类预测的模板流程
目录
六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类预测
相关文章
ML之Classification:以六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类预测案例来理解和认知机器学习分类预测的模板流程
ML之Classification:以六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类预测案例来理解和认知机器学习分类预测全部
六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类预测
数据集理解
[code]data.shape: (768, 9) data.columns: Index(['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI', 'DiabetesPedigreeFunction', 'Age', 'Outcome'], dtype='object') data.head: Pregnancies Glucose BloodPressure ... DiabetesPedigreeFunction Age Outcome 0 6 148 72 ... 0.627 50 1 1 1 85 66 ... 0.351 31 0 2 8 183 64 ... 0.672 32 1 3 1 89 66 ... 0.167 21 0 4 0 137 40 ... 2.288 33 1 [5 rows x 9 columns] <class 'pandas.core.frame.DataFrame'> RangeIndex: 768 entries, 0 to 767 Data columns (total 9 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Pregnancies 768 non-null int64 1 Glucose 768 non-null int64 2 BloodPressure 768 non-null int64 3 SkinThickness 768 non-null int64 4 Insulin 768 non-null int64 5 BMI 768 non-null float64 6 DiabetesPedigreeFunction 768 non-null float64 7 Age 768 non-null int64 8 Outcome 768 non-null int64 dtypes: float64(2), int64(7) memory usage: 54.1 KB data.info: None 8 data_column_X: ['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI', 'DiabetesPedigreeFunction', 'Age'] ['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI', 'DiabetesPedigreeFunction', 'Age']
1、kNN
[code]kNNC(n_neighbors=9):Training set accuracy: 0.792 kNNC(n_neighbors=9):Test set accuracy: 0.776
2、逻辑回归
[code]LoR(c_regular=1):Training set accuracy: 0.785 LoR(c_regular=1):Test set accuracy: 0.771
3、SVM
[code]SVMC_Init:Training set accuracy: 0.769 SVMC_Init:Test set accuracy: 0.755 SVMC_Best(max_dept=1,learning_rate=0.1):Training set accuracy: 0.788 SVMC_Best(max_dept=1,learning_rate=0.1):Test set accuracy: 0.781 DTC(max_dept=3):Training set accuracy: 0.773 DTC(max_dept=3):Test set accuracy: 0.740
4、决策树
[code]DTC(max_dept=3):Training set accuracy: 0.773 DTC(max_dept=3):Test set accuracy: 0.740
5、随机森林
[code]RFC_Best:Training set accuracy: 0.764 RFC_Best:Test set accuracy: 0.750
6、提升树
[code]GBC(max_dept=1,learning_rate=0.1):Training set accuracy: 0.804 GBC(max_dept=1,learning_rate=0.1):Test set accuracy: 0.781
7、神经网络
[code]MLPC_Init:Training set accuracy: 0.743 MLPC_Init:Test set accuracy: 0.672
相关文章推荐
- 利用tensorflow一步一步实现基于MNIST 数据集进行手写数字识别的神经网络,逻辑回归
- 机器学习概念总结笔记(二)——逻辑回归、贝叶斯分类、支持向量分类SVM、分类决策树ID3、
- 机器学习中随机森林、神经网络和xgboost的分类问题和判断分布的方法
- SVM:SVM之Classification根据已有大量数据集案例,输入已有病例的特征向量实现乳腺癌诊断高准确率预测—Jason niu
- 机器学习--感知器数据分类算法步骤(慕课网-实现简单的神经网络)
- 机器学习:神经网络、正则化、多分类问题与Python代码实现
- 【机器学习】sclearn分类算法-决策树、随机森林
- 机器学习之文本分类-神经网络TensorFlow实现(一)
- 机器学习逻辑回归神经网络手写数字识别(matlab)
- 【信用卡违约预测】逻辑回归、决策树、随机森林、SVM(R语言)
- [吴恩达 DL]Class1 Week2 神经网络基础 + 逻辑回归代码实现
- ML之回归预测:以某个数据集为例从0到1深入理解科学预测之回归(实数值年龄预测)问题的思路框架
- 神经网络不收敛不学习,分类效果相当于随机预测
- 线性回归,逻辑回归,神经网络,SVM的总结
- TF之RNN:基于顺序的RNN分类案例对手写数字图片mnist数据集实现高精度预测—Jason niu
- python机器学习库sklearn——神经网络回归预测
- 神经网络实现连续型变量的回归预测(python)
- ML之回归预测:利用13种机器学习算法对Boston(波士顿房价)数据集【13+1,506】进行回归预测(房价预测)+预测新数据得分
- 机器学习之sklearn-KNN近邻算法分类小案例(乳腺癌预测最优模型)
- stanford coursera 机器学习编程作业 exercise 3(逻辑回归实现多分类问题)