您的位置:首页 > 其它

中文分词歧义切分:严守一把手机关了

2012-03-21 13:36 155 查看
微博上看到白硕老师贴了一个:“一句话证明你搞过语言学” 的帖子

觉得很有意思,下面回帖的很多都是国内NLP界的人士。很多歧义切分、或者语义成分复杂的case非常有趣,

这些case能用来检测中文分词和语义理解的准确度。

整理了一些存在歧义的词条,放在本帖内:

严守一把手机关了 ---- 注:这是黄萱菁老师常举的例子,从Ngram的角度看,前后两个字能有多重组合:“严守、严守一、一把、一把手、把手、手机、机关、关了”

鸡不吃了

吉林省长春药店

乒乓球拍卖啦!

南京市长江大桥

吉林省长春药店

人大代表群体性事件

两会黑社会

代表北大的人大代表,代表人大的北大博士

赵军坑秦兵四十万于长亭

鸡不吃了,不吃鸡了

吃饭了吗?饭吃了吗

江阴毛纺织厂

薄熙来到重庆

我晓不得

小明在火车上画画

一个叫春的季节

中国队大胜韩国队,中国队大败韩国队

王冕死了父亲

周杰轮周杰伦,范伟骑范玮琪

无论我打败了猪还是我打胜了猪基本上总在说明它没赢我没输

孩子想死妈妈了

过路人等不得在此大小便

房产的一次性交易流程

无鸡鸭也可无鱼肉也可

我到东门去买米,东门人多挤又挤

台上坐着主席团

日照老年人

咬死猎人的狗
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: