您的位置:首页 > 编程语言 > Python开发

【原】python中文文本挖掘资料集合

2015-12-08 15:04 543 查看
这些网址是我在学习python中文文本挖掘时觉得比较好的网站,记录一下,后期也会不定期添加:

1.http://www.52nlp.cn/python-%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB-%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86-%E7%A7%91%E5%AD%A6%E8%AE%A1%E7%AE%97-%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98
非常全的网址,讲了各个库,还有github代码地址
2./article/1820833.html
Rachel Zhang的文章,运用的各种算法,可以测出准确率
3.http://www.ibm.com/developerworks/cn/data/library/bd-natural-language/
利用python、scikit和文本分析来实现行为分析
4.http://developer.51cto.com/art/201507/485276.htm
一个完整的介绍分词,从导入数据集到最后结果
5.http://www.tuicool.com/articles/U3uiiu
一个简单的例子,jieba分词
6.http://scikit-learn.org/stable/modules/feature_extraction.html
官网上对文本分析的介绍
7.http://ju.outofmemory.cn/entry/74958
scikit文本特征提取
8.http://blog.csdn.net/lsldd/article/details/41520953
一个博主写的,简单的分词
9.http://zhuanlan.zhihu.com/textmining-experience/19630762
知乎上的文本分析专栏
10.http://www.clips.ua.ac.be/pages/pattern-en#sentiment
pattern包得用法
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: