神经网络文本分类案例
2016-08-05 15:25
375 查看
1 数据来源
实验过程中,从中国期刊网上下载了600篇Web文档作为实验数据,实验数据中包括政治、经济、军事、法律、教育、体育、娱乐、科技、外语、计算机等10个主题,每个主题的数据包括60篇文档。再选择500篇文档作为训练集合。另外100篇作为测试集合。2 数据预处理
对实验数据进行预处理及特征提取SVD(Singular Value Decomposition) 奇异值分解 降维
3 设计网络拓扑结构
首先确定BP网络输出层神经元的个数,根据类别的个数来确定输出层神经元的个数.实验数据分别属于10个类,因此网络输出层神经元个数为10。输入层神经元的个数为文档在进行特征提取之后向量的维数,实验中,经过降维以后的每篇文档特征向量的维数为30。所以将网络的输入层神经元的个数选取为30。隐含层神经元个数的选取往往取决于经验或多次实验.实验中采用如下公式:
n1=n+m−−−−−√+a
这里m和n为输入层神经元和输出层神经元的个数,这里a=2,因此隐含层神经元的个数为8。
相关文章推荐
- Python即时网络爬虫项目: 内容提取器的定义(Python2.7版本)
- 安全牛课堂中心
- C# 通过IHttpModule来实现Url Rewrite,且Session有效
- dhcp服务
- Android 网络请求:Retrofit 使用
- TCP连接详解
- HttpClient
- 网络流(最大流+模板)
- TCP/IP
- RFC6020 - YANG语言标准中文
- iOS 获取当前网络状态(转载)
- Window下使用Charles对手机的Https请求进行抓包
- TCPIP协议卷2之io中断
- ubuntu搭建nfs网络文件系统
- POJ3281 Dining 网络流建图
- web服务器lighttpd 对php的支持
- Unity3D 游戏引擎之C#使用Socket与HTTP连接服务器传输数据包
- TCP连接状态详解及TIME_WAIT过多的解决方法
- Stanford机器学习---第四讲. 神经网络的表示 Neural Networks representation
- 安卓检查网络状态及WIFI