篇章语义+情感分析--有感于bluejade师兄的EMNLP11论文
2012-01-09 19:24
218 查看
最近两天拜读了bluejade师兄的论文"Unsupervised Discovery of Discourse Relation for Eliminating Intra-sentence Polarity Ambiguities"
总体的思想是通过RST理论中的篇章关系(当然,师兄用的是句子级各句间的语义关系)来辅助句子级情感分析任务
语义关系共有5大类
Contrast
Condition
Continuation
Cause
Purpose
这5类是在对RST各关系在语料的统计分析基础上合并得到的,即这5类关系会影响到句子级的情感分析的效果。
关系的抽取分为3步
构建初始模板。在RST理论基础上人工定义一些核心短语(cue phrases),并且这里是有 nucleus(n)和satellite(s)之分,即主次之分,模板的构造是考虑n和s之分的
从生语料中通过事先定义的模板来抽取关系实例,再将实例转化为SSRs(Semantic Sequential representations)表述形式,个人理解这就是对实例->模板的泛化过程。
最后,通过无指导的SSRs学习器对新的SSRs进行赋权和过滤,以得到高质量的SSRs。
对于一个有歧义的句子(在文中是指既有褒义又有贬义的句子),并且含有多于1个分段(segment,段是用逗号或分号分隔的句子),在BPC的基础上使用一下三个步骤判断整体的极性。(BPC是2010年NTCIR-8中中文评测的最好指标,可以对输出结果给出置信分值)
识别所有的篇章关系,同时识别出nucleus和sateliite
对每个篇章关系片段赋予极性。如果有冲突的情况,如是Contrast关系而两个子句的极性相同,则把置信度高的赋给整句
如果一个单一句中包含多于1个关系实例,句子的整体极性会以投票的方式来判断
总体的思想是通过RST理论中的篇章关系(当然,师兄用的是句子级各句间的语义关系)来辅助句子级情感分析任务
语义关系共有5大类
Contrast
Condition
Continuation
Cause
Purpose
这5类是在对RST各关系在语料的统计分析基础上合并得到的,即这5类关系会影响到句子级的情感分析的效果。
关系的抽取分为3步
构建初始模板。在RST理论基础上人工定义一些核心短语(cue phrases),并且这里是有 nucleus(n)和satellite(s)之分,即主次之分,模板的构造是考虑n和s之分的
从生语料中通过事先定义的模板来抽取关系实例,再将实例转化为SSRs(Semantic Sequential representations)表述形式,个人理解这就是对实例->模板的泛化过程。
最后,通过无指导的SSRs学习器对新的SSRs进行赋权和过滤,以得到高质量的SSRs。
对于一个有歧义的句子(在文中是指既有褒义又有贬义的句子),并且含有多于1个分段(segment,段是用逗号或分号分隔的句子),在BPC的基础上使用一下三个步骤判断整体的极性。(BPC是2010年NTCIR-8中中文评测的最好指标,可以对输出结果给出置信分值)
识别所有的篇章关系,同时识别出nucleus和sateliite
对每个篇章关系片段赋予极性。如果有冲突的情况,如是Contrast关系而两个子句的极性相同,则把置信度高的赋给整句
如果一个单一句中包含多于1个关系实例,句子的整体极性会以投票的方式来判断
相关文章推荐
- Word2vec之情感语义分析实战(part1)
- 语义情感趋势分析入门的一份译稿
- 机器学习基于语义特征的情感分析
- Word2vec之情感语义分析实战(part2)
- 评估文本评论情感分析的机器学习和非监督语义倾向性方法(IEEE2012)
- 每周论文清单:高质量文本生成,多模态情感分析,还有一大波GAN | PaperDaily #26
- NLP+语义分析(四)︱中文语义分析研究现状(CIPS2016、角色标注、篇章分析)
- Word2vec之情感语义分析实战(part3)--利用分布式词向量完成监督学习任务
- [语义]情感分析方向近况·0908
- Paip.语义分析----情绪情感词汇表总结
- 一周论文 | 新论文解读(情感分析、机器阅读理解、知识图谱、文本分类)
- Paip.语义分析----情绪情感词汇表总结
- 情感分析论文阅读笔记
- ffmpeg解码端代码与语义分析
- CNN for Semantic Segmentation(语义分割,论文,代码,数据集,标注工具,blog)
- BlueDroid代码分析之GKI
- 计量分析类论文如何创新-化柏林
- 论文阅读——openflow技术深入分析
- 聊天机器人 ,中文翻译,繁简 ,关键词提取,主题提取,摘要提取 ,命名体识别,分词 ,情感分析,正负类分析 ,近义词,同义词,句子相似性,聚类,监督,无监督,词性标注,词向量句子向量
- NLP在情感分析中的应用(二)