您的位置：首页 > 产品设计 > UI/UE

篇章语义+情感分析--有感于bluejade师兄的EMNLP11论文

2012-01-09 19:24 218 查看

最近两天拜读了bluejade师兄的论文"Unsupervised Discovery of Discourse Relation for Eliminating Intra-sentence Polarity Ambiguities"

总体的思想是通过RST理论中的篇章关系（当然，师兄用的是句子级各句间的语义关系）来辅助句子级情感分析任务

语义关系共有5大类

Contrast

Condition

Continuation

Cause

Purpose

这5类是在对RST各关系在语料的统计分析基础上合并得到的，即这5类关系会影响到句子级的情感分析的效果。

关系的抽取分为3步

构建初始模板。在RST理论基础上人工定义一些核心短语（cue phrases），并且这里是有 nucleus(n)和satellite(s)之分，即主次之分，模板的构造是考虑n和s之分的

从生语料中通过事先定义的模板来抽取关系实例，再将实例转化为SSRs(Semantic Sequential representations)表述形式，个人理解这就是对实例->模板的泛化过程。

最后，通过无指导的SSRs学习器对新的SSRs进行赋权和过滤，以得到高质量的SSRs。

对于一个有歧义的句子（在文中是指既有褒义又有贬义的句子），并且含有多于1个分段（segment，段是用逗号或分号分隔的句子），在BPC的基础上使用一下三个步骤判断整体的极性。（BPC是2010年NTCIR-8中中文评测的最好指标，可以对输出结果给出置信分值）

识别所有的篇章关系，同时识别出nucleus和sateliite

对每个篇章关系片段赋予极性。如果有冲突的情况，如是Contrast关系而两个子句的极性相同，则把置信度高的赋给整句

如果一个单一句中包含多于1个关系实例，句子的整体极性会以投票的方式来判断

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航