自然语言处理基础技术之命名实体识别实战
2018-11-28 21:12
411 查看
版权声明:转载请注明出处,谢谢~~ https://blog.csdn.net/m0_37306360/article/details/84592596
声明:转载请注明出处,谢谢:https://blog.csdn.net/m0_37306360/article/details/84592596
另外,更多实时更新的个人学习笔记分享,请关注:
知乎:https://www.zhihu.com/people/yuquanle/columns
公众号:StudyForAI
Stanford CoreNLP命名实体类识别
安装:pip install stanfordcorenlp
国内源安装:pip install stanfordcorenlp -i https://pypi.tuna.tsinghua.edu.cn/simple
使用stanfordcorenlp进行命名实体类识别
先下载模型,下载地址:https://nlp.stanford.edu/software/corenlp-backup-download.html
对中文进行实体识别
from stanfordcorenlp import StanfordCoreNLPzh_model = StanfordCoreNLP(r'stanford-corenlp-full-2018-02-27', lang='zh')s_zh = '我爱自然语言处理技术!'ner_zh = zh_model.ner(s_zh)s_zh1 = '我爱北京天安门!'ner_zh1 = zh_model.ner(s_zh1)print(ner_zh)print(ner_zh1)
[('我爱', 'O'), ('自然', 'O'), ('语言', 'O'), ('处理', 'O'), ('技术', 'O'), ('!', 'O')][('我爱', 'O'), ('北京', 'STATE_OR_PROVINCE'), ('天安门', 'FACILITY'), ('!', 'O')]
对英文进行实体识别
eng_model = StanfordCoreNLP(r'stanford-corenlp-full-2018-02-27')s_eng = 'I love natural language processing technology!'ner_eng = eng_model.ner(s_eng)s_eng1 = 'I love Beijing Tiananmen!'ner_eng1 = eng_model.ner(s_eng1)print(ner_eng)print(ner_eng1)
[('I', 'O'), ('love', 'O'), ('natural', 'O'), ('language', 'O'), ('processing', 'O'), ('technology', 'O'), ('!', 'O')][('I', 'O'), ('love', 'O'), ('Beijing', 'CITY'), ('Tiananmen', 'LOCATION'), ('!', 'O')]
Hanlp命名实体类识别
安装:pip install pyhanlp
国内源安装:pip install pyhanlp -i https://pypi.tuna.tsinghua.edu.cn/simple
通过crf算法识别实体
from pyhanlp import *# 音译人名示例CRFnewSegment = HanLP.newSegment("crf")term_list = CRFnewSegment.seg("我爱北京天安门!")print(term_list)
[我/r, 爱/v, 北京/ns, 天安门/ns, !/w]
NLTK词性标注
安装:pip install nltk
国内源安装:pip install nltk -i https://pypi.tuna.tsinghua.edu.cn/simple
import nltks = 'I love natural language processing technology!'s_token = nltk.word_tokenize(s)s_tagged = nltk.pos_tag(s_token)s_ner = nltk.chunk.ne_chunk(s_tagged)print(s_ner)
spaCy命名实体识别
安装:pip install spaCy
国内源安装:pip install spaCy -i https://pypi.tuna.tsinghua.edu.cn/simple
import spacyeng_model = spacy.load('en')s = 'I want to Beijing learning natural language processing technology!'<4000/pre>
命名实体识别
s_ent = eng_model(s)for ent in s_ent.ents:print(ent, ent.label_, ent.label)Beijing GPE 382
相关文章推荐
- 基于深层神经网络的命名实体识别技术
- 哈工大ltp,分词,词性标注,命名实体识别技术的特征提取
- 基于深层神经网络的命名实体识别技术
- 基于深层神经网络的命名实体识别技术
- 基于深层神经网络的命名实体识别技术
- 命名实体识别(named entity recognition )基于统计方法的技术比较
- 基于深层神经网络的命名实体识别技术
- 自然语言处理基础技术之语义角色标注实战
- 基于深层神经网络的命名实体识别技术
- 基于深层神经网络的命名实体识别技术
- 基于深层神经网络的命名实体识别技术
- 自然语言处理之命名实体识别-tanfordcorenlp-NER(一)
- 基于深层神经网络的命名实体识别技术
- 中文词性标注以及命名实体识别
- 自然语言处理基础技术之语义角色标注
- ansj 5.1分词方式测试,存在分词命名实体识别过度的问题
- 自然语言处理基础(4)--数据平滑技术
- 命名实体识别和分类(NERC)及详细使用
- 中文命名实体识别之学习笔记一(词性标注)
- NLTK命名实体识别