对于observation or feature 的两种利用方式
2013-10-10 23:11
190 查看
对于text dataset, 每篇doc 一般都有对应的metadata(side information), 还有容易得到的一些feature e.g. pos, np chunking, wordnet
1. word 本身
2. metadata
3. feature
都算是我们的observation, 利用的方式有两种,
第一种就是用generative model, 意淫这些observation的生成过程,即model p(word 本身, metadata, feature)
第二种就是用discriminative model,把某些observation看做condition, 其余的observation看做generative的东西,
例如 p(word 本身, metadata | feature) 就是在feature这个条件下意淫word与metadata的生成过程
ref: jun zhu "conditional topic random fields"
mimno "topic models conditioned on arbitrary features with dirichlet-multinomial regression"
1. word 本身
2. metadata
3. feature
都算是我们的observation, 利用的方式有两种,
第一种就是用generative model, 意淫这些observation的生成过程,即model p(word 本身, metadata, feature)
第二种就是用discriminative model,把某些observation看做condition, 其余的observation看做generative的东西,
例如 p(word 本身, metadata | feature) 就是在feature这个条件下意淫word与metadata的生成过程
ref: jun zhu "conditional topic random fields"
mimno "topic models conditioned on arbitrary features with dirichlet-multinomial regression"
相关文章推荐
- java 利用FileOutputStream写文件(两种方式)
- C#对于md5加密的两种方式
- 对于String对象,可以使用"="赋值,也可以使用"new"关键字赋值,两种方式有什么区别?
- uboot传递initrd(initramfs or ramdisk) 到kernel的两种方式
- 对于携带请求参数的HttpGet与的HttpPost两种请求方式,代码段分析
- java基础复习之对于String对象,能够使用“=”赋值,也能够使用newkeyword赋值,两种方式有什么差别?
- MFC利用ADO建立access数据源 ---包括访问带access密码与不带access密码两种方式)
- 在使用 SQL Server 的过程中,用户遇到最多的问题莫过于连接失败了。一般而言,有两种连接SQL Server 的方式,一是利用 SQL Server 自带的客户端工具
- MPLS TE 利用PBR将数据引入隧道的两种方式
- 对于保证浮点数计算的正确性,有两种常见方式
- 利用"SQL"语句自动生成序号的两种方式
- HashMap 对于获得 键值 的两种实现方式 ,要对 hashmap treemap 的实现 多关注
- linq 实现查询字符串拼接 : And 和 OR 两种方式
- 利用hibernate实现多条件组合查询的两种方式(2017年5月18日22:45:09)
- linq 实现查询字符串拼接 : And 和 OR 两种方式
- 利用Ajax实现的广告流动条的两种方式
- linq 实现查询字符串拼接 : And 和 OR 两种方式
- 利用Spring进行统一异常处理的两种方式
- Unity实现绘制线断一 ――――利用LineRenderer组件划线的两种方式
- Ajax中对于与禁止缓存的两种方式