《机器学习》周志华 习题答案7.3
2016-07-05 14:55
246 查看
运用贝叶斯方法对西瓜数据集进行分类,同理代码如下:
结果如下:Numberofmislabeledpointsoutofatotal17points:2
[11111111000000000]
[11111101000000100]
如果选取的属性过小,则分类的错误率会增加。
file1=open('c:\quant\watermelon.csv','r') data=[line.strip('\n').split(',')forlineinfile1] data=np.array(data) X=[[float(raw[-7]),float(raw[-6]),float(raw[-5]),float(raw[-4]),float(raw[-3]),float(raw[-2])]forrawindata[1:,1:-1]] #X=[[float(raw[-3]),float(raw[-2])]forrawindata[1:]] y=[1ifraw[-1]=='1'else0forrawindata[1:]] X=np.array(X) y=np.array(y) fromsklearnimportdatasets iris=datasets.load_iris() fromsklearn.naive_bayesimportGaussianNB gnb=GaussianNB() y_pred=gnb.fit(X,y).predict(X) print("Numberofmislabeledpointsoutofatotal%dpoints:%d" %(X.shape[0],(y!=y_pred).sum())) printy printy_pred
结果如下:Numberofmislabeledpointsoutofatotal17points:2
[11111111000000000]
[11111101000000100]
如果选取的属性过小,则分类的错误率会增加。
相关文章推荐
- C++ Scoket的升级版(多态的运用)
- Ccookie被禁用session还能用么?
- Spring IOC容器初始化过程分析
- nginx+GraphicsMagick实现缩略图、图片实时缩放
- angularJS的controller之间如何正确的通信
- hibernate自动键表报MySQL server version for the right syntax to use near 'type=InnoDB' at line 1
- Spark提交任务到集群
- 【那些年遇到过的面试题】tcpdump
- C# Http网络访问类
- Android Studio Template模板 制作模板
- 使用Eclipse编译运行MapReduce程序_Hadoop2.6.0_Ubuntu/CentOS
- OpenGL的glClearColor和glClear改变背景颜色
- bloom filter
- DZNEmptyDataSet实现的分析
- Linux新系统优化
- 关于设置Java虚拟机(JVM)的内存问题
- Apache与Nginx的优缺点
- Android开发之内容解析者ContentResolver
- 这是我做的一个比较简单的基于Android的APP的demo
- css 块状元素和行内元素