您的位置:首页 > 其它

文本分析常用R包的安装(Rweibo、wordcloud、tm、tmcn、Rwordseg)

2016-05-25 02:57 295 查看
为了使用文本分析挖掘,必须要先安装一些R包,比如Rwordseg包常用于分词、tmcn用于词频统计、wordcloud用于绘制文字云。在R中,有些包是需要额外设置安装的,且设置起挺麻烦的,因此,以下总结并共享了一些解决方法,以供大家参考。

系统测试环境:

win10 64bit

R x64 3.3.0

Java 1.8.0_91-64bit

0.前置操作:

首先,要安装R软件,下载地址:https://www.r-project.org/

其次,需设定scan镜像,安装完成后打开R软件,在程序包-设定scan镜像菜单中选择镜像设定地址

比如可以选择为:China Beijing4 [https],它是R设在中国北京的第4台服务器。

然后,可以开始以下的安装了,当界面中有提示“ 程序包‘XXX’打开成功,MD5和检查也通过”或者“DONE (XX)”时表示安装成功

1、Rweibo包的安装

由于Rweibo依赖于RCurl、XML、rjson、digest这四个包,需要先装上后再装Rweibo包,执行代码如下:

install.packages("bitops") #RCurl的依赖

install.packages("RCurl")

install.packages("XML")

install.packages("rjson")

install.packages("digest")

install.packages("Rweibo",repos="http://R-Forge.R-project.org")

执行完成后加载library就可以用哒,代码如下:

library(Rweibo)

2、wordcloud包的安装

wordcloud包R自带,执行代码如下:
install.packages("wordcloud")
执行完成后同样需要加载library才能使用此包,代码如下:
library(wordcloud)
3、tm包的安装

与wordcloud包的安装方法相同,代码如下:

install.packages("tm")

library(tm)

4、tmcn包的安装

下载源码.zip文件,在R中采用本地安装方式进行安装
Rwordseg.zip下载地址:https://r-forge.r-project.org/R/?group_id=1571
注意:”install.packages("tmcn", repos="http://R-Forge.R-project.org",type="source")“及jar包无法直接解析
5、Rwordseg包的安装

第一步:安装好Java环境及rJava包,并确定rJava包的可用性

先要安装和配置Java环境,参考方法:http://jingyan.baidu.com/article/e75aca85b29c3b142edac6a8.html

jdk下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

然后执行以下命令:
install.packages("rJava") #Rwordseg的依赖
rJava包的测试:
如遇到rJava包的错误,一般是java安装版本问题或者环境变量设置问题
相关测试可以参考:http://blog.fens.me/r-rjava-java/
第二步:下载源码.zip文件,在R中采用本地安装方式进行安装
Rwordseg.zip下载地址:https://r-forge.r-project.org/R/?group_id=1054

注意:“install.packages("Rwordseg",repos="http://R-Forge.R-project.org")”及jar包均无法直接解析

Rwordseg包的测试:

> library(Rwordseg)

载入需要的程辑包:rJava

# Version: 0.2-1

> teststring1 <- "花儿为什么这样红"

> segmentCN(teststring1)

[1] "花儿" "为什么" "这样" "红"

PS: 本文中所提到的相关软件包已分享至百度云盘,包括文件分析R包、R安装包、Java安装包

分享地址:http://pan.baidu.com/s/1kUZBNfT

提取密码:kteu
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: