中文文本挖掘包tm、tmcn、Rwordseg、Rweibo的安装
2014-05-16 18:24
330 查看
(此文为回忆后撰写,未进行重新测试,故不尽之处敬请指出。)
1、tm包是R中文本挖掘的通用包。直接使用
2、tmcn、Rwordseg、Rweibo是李舰等人开发的中文文本挖掘包。详见
http://jliblog.com/app/tmcn
http://jliblog.com/app/rwordseg
http://jliblog.com/app/rweibo
三个网页中提供了包说明与安装方法。但经测试,其中的安装方法不可用。
(相对于jiliblog.com,r-forge的信息更新)
3、我的安装方法
(1)下载tmcn、Rwordseg、Rweibo的源码
tmcn:https://r-forge.r-project.org/R/?group_id=1571
Rwordseg:(r-forge中找到)
Rweibo:https://r-forge.r-project.org/projects/rweibo/
(2)tmcn无依赖关系,直接使用
(3)Rwordseg依赖于rJava:
同时,该包需要安装了Java环境。如果未曾安装Java,请先安装,安装(及PATH的配置)过程不再赘述。
(4)Rweibo依赖于RCurl、rjson、XML、digest四个包
这四个依赖包同样不能直接安装,需要先从科大源下载源码:(按包名搜索RCurl、XML、rjson、digest)
http://mirrors.ustc.edu.cn/CRAN/web/packages/available_packages_by_name.html
安装:
1、tm包是R中文本挖掘的通用包。直接使用
install.packages("tm")
2、tmcn、Rwordseg、Rweibo是李舰等人开发的中文文本挖掘包。详见
http://jliblog.com/app/tmcn
http://jliblog.com/app/rwordseg
http://jliblog.com/app/rweibo
三个网页中提供了包说明与安装方法。但经测试,其中的安装方法不可用。
(相对于jiliblog.com,r-forge的信息更新)
3、我的安装方法
(1)下载tmcn、Rwordseg、Rweibo的源码
tmcn:https://r-forge.r-project.org/R/?group_id=1571
Rwordseg:(r-forge中找到)
Rweibo:https://r-forge.r-project.org/projects/rweibo/
(2)tmcn无依赖关系,直接使用
install.packages("~/Downloads/tmcn_0.1-3.tar", repos=NULL, type="source")
(3)Rwordseg依赖于rJava:
install.packages("rJava") install.packages("~/Downloads/Rwordseg_0.2-1.tar", repos=NULL, type="source")
同时,该包需要安装了Java环境。如果未曾安装Java,请先安装,安装(及PATH的配置)过程不再赘述。
(4)Rweibo依赖于RCurl、rjson、XML、digest四个包
这四个依赖包同样不能直接安装,需要先从科大源下载源码:(按包名搜索RCurl、XML、rjson、digest)
http://mirrors.ustc.edu.cn/CRAN/web/packages/available_packages_by_name.html
安装:
install.packages("bitops") #RCurl的依赖 install.packages("~/Downloads/RCurl_1.95-4.1.tar", repos=NULL, type="source") install.packages("~/Downloads/XML_3.98-1.1.tar", repos=NULL, type="source") install.packages("~/Downloads/rjson_0.2.13.tar", repos=NULL, type="source") install.packages("~/Downloads/digest_0.6.4.tar", repos=NULL, type="source") install.packages("~/Downloads/Rweibo_0.2-9.tar", repos=NULL, type="source")
相关文章推荐
- 文本分析常用R包的安装(Rweibo、wordcloud、tm、tmcn、Rwordseg)
- PyMining-开源中文文本数据挖掘平台 Ver 0.2发布
- python 中文分词,安装 pymmseg
- R语言做文本挖掘 Part1安装依赖包
- python: 中文分词器pymmseg的编译安装
- 【R文本挖掘】中文分词Rwordseg
- 支持中文文本的数据挖掘平台开源项目PyMining发布
- R语言做文本挖掘 Part1安装依赖包
- Python 文本挖掘:jieba中文分词和词性标注
- R语言 文本挖掘 tm包 使用
- Pluto中文文本分析能力的数据挖掘平台
- 应用定性数据分析包RQDA(Qualitative Data Analysis)和文挖掘框架包tm结合进行文本挖掘
- Zend Studio 8.0.1 官方汉化包安装 && 解决文本中文乱码
- R语言tm工具包进行文本挖掘实验
- 支持中文文本的数据挖掘平台开源项目PyMining发布
- Zend Studio 8.0.1 官方汉化包安装 && 解决文本中文乱码
- R学习之——R用于文本挖掘(tm包)
- python中文分词器pymmseg的安装实录
- 中文文本挖掘的贝叶斯分类器&SVM
- 【原】python中文文本挖掘资料集合