笔记-2004-基于无指导学习策略的无词表条件下的汉语自动分词
2012-10-21 18:43
225 查看
基于无指导学习策略的无词表条件下的汉语自动分词
孙茂松,肖明,邹嘉彦
清华大学、香港城市大学
2004年6月计算机学报
互信息、t-测试差、线性叠加、波峰波谷
由于这个时候还没有SIGHAN2005,所以不好评说这个的效果,但是思想很好
互信息,用于检查两个字的结合紧密程度,注意,互信息是二元的,多于二元的都不行。
t-测试差的作用也是这样,但是公式不同,都是越大,结合越紧密
然后,md=f( 互信息)+a*g(t-测试差);
用md去进行比较,一句话的md有大有小,连起来刚好会形成一个波浪线,波峰则为连接,波谷则为断开。
最近这4篇文章都为无监督学习分词
孙茂松,肖明,邹嘉彦
清华大学、香港城市大学
2004年6月计算机学报
互信息、t-测试差、线性叠加、波峰波谷
由于这个时候还没有SIGHAN2005,所以不好评说这个的效果,但是思想很好
互信息,用于检查两个字的结合紧密程度,注意,互信息是二元的,多于二元的都不行。
t-测试差的作用也是这样,但是公式不同,都是越大,结合越紧密
然后,md=f( 互信息)+a*g(t-测试差);
用md去进行比较,一句话的md有大有小,连起来刚好会形成一个波浪线,波峰则为连接,波谷则为断开。
最近这4篇文章都为无监督学习分词
相关文章推荐
- 自动车牌识别(ANPR)练习项目学习笔记3(基于opencv)
- 自动车牌识别(ANPR)练习项目学习笔记4(基于opencv)
- 自动车牌识别(ANPR)练习项目学习笔记2(基于opencv)
- 基于压缩感知机的中文分词学习笔记
- 策略建模--基于机器学习 学习笔记
- 自动车牌识别(ANPR)练习项目学习笔记1(基于opencv)
- SHELL学习笔记----IF条件判断,判断条件
- 基于spring source tools suite注解的spring3.0.x MVC学习笔记(二)
- 基于Netty的RPC架构笔记6之protocol buff学习
- 设计模式之策略模式——极客学院学习笔记
- 基于HTK的连续语音识别系统搭建学习笔记(一)
- NET 应用架构指导 V2 学习笔记(五) 软件架构的模式和风格
- 39.Oracle深度学习笔记——自动创建ASM UDEV设备脚本
- Linux 学习笔记 -- 第五部分 Linux 系统管理员 -- 第25章 Linux 备份策略
- swift语言的学习笔记六(ARC-自动引用计数,内存管理)
- java学习笔记-设计模式14(策略模式)
- 关于SpringBoot中基于条件的自动装配
- spring学习笔记 -- day08 基于XML的Spring中的AOP
- IAM 策略文档学习笔记
- 深度学习(DL)与卷积神经网络(CNN)学习笔记随笔-02-基于Python的卷积运算