您的位置：首页 > 其它

【点击模型学习笔记】A survey on click modeling in web search_Lianghao Li_ppt

2014-06-08 17:10 330 查看

是一篇综述性质的ppt。

主要内容：

对搜索中的广告点击预测，总结学术界的研究成果。

搜索广告主要展示位为：1. 搜索结果页面最上侧；2. 搜索结果右侧。

研究意义：广告点击次数直接影响收入

问题抽象：对于某个query q，和某个广告ad，预测用户对它们的点击率。

具体内容：

1. 最简单的点击模型：通过点击次数来预测，计算公式为

P = #count of clicks / #count of impressions(展现)

缺点：点击受到用户浏览行为的影响；对于长尾query和ad，存在冷启动问题。

2. 点击模型：a unified framework——实际上是把各个因素罗列出来

u -- user

q -- query

a -- ad

r -- position of ad

c -- click, 1 if a is clicked by u

L -- the impression list

S -- the click sequence

点击模型的任务就是通过用户的点击日志来预测广告的未来点击，形式化的说，就是在未来的展现中，计算 P(c=1| q,a,u,r,L,S)的值

3. 点击模型的不同层次的假设

（1）unbiased hypothesis: P(c | q,a,u,r,L,S) = P(c|q,a)

（2）position bias hypothesis: P(c | q,a,u,r,L,S) = P(c|q,a,r)

（3）depend on click pattern: P(c | q,a,u,r,L,S) = P(c|q,a,r,S)

（4）depend on ad externality: P(c | q,a,u,r,L,S) = P(c|q,a,r,L)

（5）depend on user intent: P(c | q,a,u,r,L,S) = P(c|q,a,u,r)

展开来说：

3 - 1：unbiased hypothesis

点击只和query以及广告自身有关，不考虑任何因素

3 - 2：position bias hypothesis

examination hypothesis：将用户的examine的过程考虑进来，将“用户点击”这个事件分解为两个事件，即“用户examine”和“用户点击”。在此基础上，概率分解：

P(c|q,a,r) = P(e=1|r) * P(c=1|q,a,e=1)

其中，P(e=1|r) 表示在位置r，用户查看（examine）的概率。可以通过跟踪人眼盯在屏幕上的位置（热度）来获得；也可以通过将相同的ad放在不同的位置，来计算点击率获得，不过这种方法貌似代价比较大。

3 - 3：depend on click pattern

看这个ppt的感觉就是，模型越用越复杂，怀疑在实际中真的有用么？

cascade hypothesis(wsdm08)：是examination hypothesis的进一步深化，即在examination hypothesis的基础上，进一步假设用户是顺序examine ad的，并把这种检查顺序放到了条件概率里面

multiple-click model(wsdm09)：在cascade hypothesis的基础上融合了用户的多次点击，隐含假设是，在一个结果列表中，用户通常要通过多次点击来完成需求满足。具体做法上，对于某个ad，将用户点击和非点击的概率线性插值起来，整体做法上还是类似cascade hypothesis的。

DBN(wsdm09)：套用DBN来对用户examine和点击进行建模

上面三种方法，实验结果中，貌似DBN最好，不过，看到logistic作为baseline，也不差

3 - 4：depend on ad externality

这个假设，将ad列表中ad之间的关系也建模进去了，貌似更加脱离实际应用。

temporal click model(sigir09)：关键假设是，一个ad如果和更高质量的ad放在一起展示，那么这个ad的点击率会下降。用graph model来描述这种关系。

relational click predication(wsdm12)：关键假设，展示的ad列表，ad之间的相似程度会影响ad的点击率。作法，将ad列表作为一个整体对待，而不是针对每个ad进行分别对待，用crf来描述。

3 - 5：depend on user intent

task centric click model(kdd11)：关键假设，用户逐渐精细化的表述他的需求（通过越来越精确的query），并且倾向于点击不在从前query中出现的文档（新文档）。用graph model来做的。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航