您的位置：首页 > 理论基础 > 计算机网络

神经网络文本分类案例

2016-08-05 15:25 375 查看

1 数据来源

实验过程中，从中国期刊网上下载了600篇Web文档作为实验数据，实验数据中包括政治、经济、军事、法律、教育、体育、娱乐、科技、外语、计算机等10个主题，每个主题的数据包括60篇文档。再选择500篇文档作为训练集合。另外100篇作为测试集合。

2 数据预处理

对实验数据进行预处理及特征提取

SVD（Singular Value Decomposition）奇异值分解降维

3 设计网络拓扑结构

首先确定BP网络输出层神经元的个数，根据类别的个数来确定输出层神经元的个数．实验数据分别属于10个类，因此网络输出层神经元个数为10。输入层神经元的个数为文档在进行特征提取之后向量的维数，实验中，经过降维以后的每篇文档特征向量的维数为30。所以将网络的输入层神经元的个数选取为30。

隐含层神经元个数的选取往往取决于经验或多次实验．实验中采用如下公式：

n1=n+m−−−−−√+a

这里m和n为输入层神经元和输出层神经元的个数，这里a=2，因此隐含层神经元的个数为8。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航