hadoop-R语言-安装NLP自然语言分析包
2016-12-27 10:47
344 查看
引言: R语言是一种非常强大的分析与展示的统计科学家工具,其也提供了若干关于自然语言的分析处理工具,本文讲展示如何在Linux进行安置。
1. 自然语言处理(NLP) 对于英语体系,基于空格可以直接进行分词,而中文则不同,需要进行分词,然后进行后续处理。NLP是natural language processing的缩写,专指此类的工作。 自然语言处理包: Snowball, RWeka 文本挖掘: tm 分词工具: Rwordseg2. 所属环境 Linux: centos 6, 已经安置Java, 由于Rwordseg需要依赖java3. 安置指令与过程 3.1 安装R语言环境 >> yum install R
3.2 安装Snowball >> install.packages(c('Snowball')) 其会提示该包没有找到,需要使用以下包: >> install.packages(c('SnowballC'))
3.3 安装tm >> install.packages(c('tm'))
3.4 安装RWeka >> install.packages(c('RWeka'))
3.5 安装Rwordseg 直接执行install.packages(c('Rwordseg'))将会报错,提示找不到此类包。 需要切换到install.packages("Rwordseg", repos ="http://R-Forge.R-project.org", type = "source"),从另外一个源中进行安装。
3.6 结束 安装完成了所有必须的NLP。
1. 自然语言处理(NLP) 对于英语体系,基于空格可以直接进行分词,而中文则不同,需要进行分词,然后进行后续处理。NLP是natural language processing的缩写,专指此类的工作。 自然语言处理包: Snowball, RWeka 文本挖掘: tm 分词工具: Rwordseg2. 所属环境 Linux: centos 6, 已经安置Java, 由于Rwordseg需要依赖java3. 安置指令与过程 3.1 安装R语言环境 >> yum install R
3.2 安装Snowball >> install.packages(c('Snowball')) 其会提示该包没有找到,需要使用以下包: >> install.packages(c('SnowballC'))
3.3 安装tm >> install.packages(c('tm'))
3.4 安装RWeka >> install.packages(c('RWeka'))
3.5 安装Rwordseg 直接执行install.packages(c('Rwordseg'))将会报错,提示找不到此类包。 需要切换到install.packages("Rwordseg", repos ="http://R-Forge.R-project.org", type = "source"),从另外一个源中进行安装。
3.6 结束 安装完成了所有必须的NLP。
相关文章推荐
- R语言安装NLP自然语言分析包
- R语言安装NLP自然语言分析包
- 人工智能-语音交互-NLP自然语言(四) 句法分析/词向量
- 利用百度nlp 来进行 各种自然语言分析和 文本分析
- 如何在美国公司写project plan 邮件--以hadoop安装和Mahout数据分析为例子
- 斯坦福自然语言组的NLP及计算语言学的资料汇总
- Hadoop性能分析工具Hitune的安装(centos)
- 自然语言(NLP)方面的资源
- R语言为Hadoop集群数据统计分析带来革命性变化
- 自然语言分析的一些感想
- nlpers上面关于自然语言处理(NLP)如何入门的文章
- 自然语言分析之命名实体识别_Stanford Named Entity Recognizer (NER)简单实例
- R语言为Hadoop集群数据统计分析带来革命性变化
- 自然语言情感倾向分析笔记
- Hadoop性能分析工具Hitune的安装(centos)
- R语言linux 安装命令,特征之间的相关系数分析实例
- R语言和Hadoop系统架构在大数据分析中的应用
- R语言为Hadoop集群数据统计分析带来革命性变化
- R语言为Hadoop集群数据统计分析带来革命性变化
- R语言为Hadoop集群数据统计分析带来革命性变化