您的位置:首页 > 编程语言 > Java开发

Stanford3.8.0依存句法分析在java中运行

2017-12-28 13:14 399 查看
linux 下的Stanford词性标注

java -mx1g -cp "/home/hadoop/stanford-corenlp-full-2017-06-09/stanford-postagger.jar:" edu.stanford.nlp.tagger.maxent.MaxentTagger -model "/home/hadoop/stanford-corenlp-full-2017-06-09/models/chinese-distsim.tagger" -textFile source.txt > result-linux.txt

win7下的Stanford 依存句法分析
java -mx150m -cp "*;" edu.stanford.nlp.parser.lexparser.LexicalizedParser -outputFormat "penn,typedDependencies" lexparser/chinesePCFG.ser.gz source.txt > my.txt

linux 下的Stanford 依存句法分析

java -mx150m -cp "/home/hadoop/stanford-parser-full-2017-06-09/*:" edu.stanford.nlp.parser.lexparser.LexicalizedParser -outputFormat "penn,typedDependencies" lexparser/chinesePCFG.ser.gz source.txt > my.txt

(ROOT
(IP
(NP (NR 张传庆))
(VP
(ADVP (AD 曾))
(PP (P 在)
(LCP
(NP
(QP (CD 许多))
(NP (NR 中国) (NN 引水) (NN 隧洞) (NN 项目)))
(LC 中)))
(VP (VV 发挥)
(NP
(ADJP (JJ 重要))
(NP (NN 作用。)))))))

nsubj(发挥-10, 张传庆-1)
advmod(发挥-10, 曾-2)
case(项目-8, 在-3)
dep(项目-8, 许多-4)
compound:nn(项目-8, 中国-5)
compound:nn(项目-8, 引水-6)
compound:nn(项目-8, 隧洞-7)
nmod:prep(发挥-10, 项目-8)
case(项目-8, 中-9)
root(ROOT-0, 发挥-10)
amod(作用。-12, 重要-11)
dobj(发挥-10, 作用。-12)

去掉penn
java -mx150m -cp "/home/hadoop/stanford-parser-full-2017-06-09/*:" edu.stanford.nlp.parser.lexparser.LexicalizedParser -outputFormat "typedDependencies" lexparser/chinesePCFG.ser.gz source.txt > my.txt
只显示penn
输出:
SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder".
SLF4J: Defaulting to no-operation (NOP) logger implementation
SLF4J: See http://www.slf4j.org/codes.html#StaticLoggerBinder for further details.
Parsing file: source.txt
Parsing [sent. 1 len. 12]: 张传庆 曾 在 许多 中国 引水 隧洞 项目 中 发挥 重要 作用。
Parsed file: source.txt [1 sentences].
Parsed 12 words in 1 sentences (7.22 wds/sec; 0.60 sents/sec).
hadoop@master:~/stanford-parser-full-2017-06-09$ cat my.txt
nsubj(发挥-10, 张传庆-1)
advmod(发挥-10, 曾-2)
case(项目-8, 在-3)
dep(项目-8, 许多-4)
compound:nn(项目-8, 中国-5)
compound:nn(项目-8, 引水-6)
compound:nn(项目-8, 隧洞-7)
nmod:prep(发挥-10, 项目-8)
case(项目-8, 中-9)
root(ROOT-0, 发挥-10)
amod(作用。-12, 重要-11)
dobj(发挥-10, 作用。-12)

java -mx150m -cp "/home/hadoop/stanford-parser-full-2017-06-09/*:" edu.stanford.nlp.parser.lexparser.LexicalizedParser -outputFormat "penn" lexparser/chinesePCFG.ser.gz source.txt > my.txt

输出
SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder".
SLF4J: Defaulting to no-operation (NOP) logger implementation
SLF4J: See http://www.slf4j.org/codes.html#StaticLoggerBinder for further details.
Parsing file: source.txt
Parsing [sent. 1 len. 12]: 张传庆 曾 在 许多 中国 引水 隧洞 项目 中 发挥 重要 作用。
Parsed file: source.txt [1 sentences].
Parsed 12 words in 1 sentences (20.76 wds/sec; 1.73 sents/sec).
hadoop@master:~/stanford-parser-full-2017-06-09$ cat my.txt
(ROOT
(IP
(NP (NR 张传庆))
(VP
(ADVP (AD 曾))
(PP (P 在)
(LCP
(NP
(QP (CD 许多))
(NP (NR 中国) (NN 引水) (NN 隧洞) (NN 项目)))
(LC 中)))
(VP (VV 发挥)
(NP
(ADJP (JJ 重要))
(NP (NN 作用。)))))))
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: