您的位置：首页 > 其它

机器翻译（待续）

2014-12-09 16:30 204 查看

机器翻译 = 语言模型 + 翻译模型

语言模型如：N元语言模型

N元语言模型

举例，三元语言模型，一个词至于它相邻的2个词有关。

条件概率

P（我吃饭）表示词语组合合理的概率。

P（我吃饭）= P（饭|我吃）*P（我吃）

P（我吃） = P（吃|我）*P（我）

得到：

P（我吃饭）= P（饭|我吃）*P（吃|我）*p（我）；

基础统计概率这样得到：

[统计词频得到]

P（我）= C（我）/C(X) ;

P（吃|我）= C（我X）/ C（我吃）

P（饭|我吃）= C（我吃饭）/ C（我吃X）

在语音识别或者OCR中，如果识别三个字，前两个识别为我吃，

单从第三个字的声音来看，有40%的概率识别为“饭”，有50%的概率识别为“蛋”。

但是P（饭 | 我吃）的概率为50%，P（蛋|我吃）的概率为10%。

综合考虑：

P（我吃饭）= P（饭）* P（饭 | 我吃）=40%*50%

P（我吃蛋）= P（蛋）* P（蛋|我吃） =50%*10%

所以该字被翻译成饭更合适一些。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

添加评论
分享网址
分享文章
返回顶部