【点击模型学习笔记】A survey on click modeling in web search_Lianghao Li_ppt
2014-06-08 17:10
330 查看
是一篇综述性质的ppt。
主要内容:
对搜索中的广告点击预测,总结学术界的研究成果。
搜索广告主要展示位为:1. 搜索结果页面最上侧;2. 搜索结果右侧。
研究意义:广告点击次数直接影响收入
问题抽象:对于某个query q,和某个广告ad,预测用户对它们的点击率。
具体内容:
1. 最简单的点击模型:通过点击次数来预测,计算公式为
P = #count of clicks / #count of impressions(展现)
缺点:点击受到用户浏览行为的影响;对于长尾query和ad,存在冷启动问题。
2. 点击模型:a unified framework——实际上是把各个因素罗列出来
u -- user
q -- query
a -- ad
r -- position of ad
c -- click, 1 if a is clicked by u
L -- the impression list
S -- the click sequence
点击模型的任务就是通过用户的点击日志来预测广告的未来点击,形式化的说,就是在未来的展现中,计算 P(c=1| q,a,u,r,L,S)的值
3. 点击模型的不同层次的假设
(1)unbiased hypothesis: P(c | q,a,u,r,L,S) = P(c|q,a)
(2)position bias hypothesis: P(c | q,a,u,r,L,S) = P(c|q,a,r)
(3)depend on click pattern: P(c | q,a,u,r,L,S) = P(c|q,a,r,S)
(4)depend on ad externality: P(c | q,a,u,r,L,S) = P(c|q,a,r,L)
(5)depend on user intent: P(c | q,a,u,r,L,S) = P(c|q,a,u,r)
展开来说:
3 - 1:unbiased hypothesis
点击只和query以及广告自身有关,不考虑任何因素
3 - 2:position bias hypothesis
examination hypothesis:将用户的examine的过程考虑进来,将“用户点击”这个事件分解为两个事件,即“用户examine”和“用户点击”。在此基础上,概率分解:
P(c|q,a,r) = P(e=1|r) * P(c=1|q,a,e=1)
其中,P(e=1|r) 表示在位置r,用户查看(examine)的概率。可以通过跟踪人眼盯在屏幕上的位置(热度)来获得;也可以通过将相同的ad放在不同的位置,来计算点击率获得,不过这种方法貌似代价比较大。
3 - 3:depend on click pattern
看这个ppt的感觉就是,模型越用越复杂,怀疑在实际中真的有用么?
cascade hypothesis(wsdm08):是examination hypothesis的进一步深化,即在examination hypothesis的基础上,进一步假设用户是顺序examine ad的,并把这种检查顺序放到了条件概率里面
multiple-click model(wsdm09):在cascade hypothesis的基础上融合了用户的多次点击,隐含假设是,在一个结果列表中,用户通常要通过多次点击来完成需求满足。具体做法上,对于某个ad,将用户点击和非点击的概率线性插值起来,整体做法上还是类似cascade hypothesis的。
DBN(wsdm09):套用DBN来对用户examine和点击进行建模
上面三种方法,实验结果中,貌似DBN最好,不过,看到logistic作为baseline,也不差
3 - 4:depend on ad externality
这个假设,将ad列表中ad之间的关系也建模进去了,貌似更加脱离实际应用。
temporal click model(sigir09):关键假设是,一个ad如果和更高质量的ad放在一起展示,那么这个ad的点击率会下降。用graph model来描述这种关系。
relational click predication(wsdm12):关键假设,展示的ad列表,ad之间的相似程度会影响ad的点击率。作法,将ad列表作为一个整体对待,而不是针对每个ad进行分别对待,用crf来描述。
3 - 5:depend on user intent
task centric click model(kdd11):关键假设,用户逐渐精细化的表述他的需求(通过越来越精确的query),并且倾向于点击不在从前query中出现的文档(新文档)。用graph model来做的。
主要内容:
对搜索中的广告点击预测,总结学术界的研究成果。
搜索广告主要展示位为:1. 搜索结果页面最上侧;2. 搜索结果右侧。
研究意义:广告点击次数直接影响收入
问题抽象:对于某个query q,和某个广告ad,预测用户对它们的点击率。
具体内容:
1. 最简单的点击模型:通过点击次数来预测,计算公式为
P = #count of clicks / #count of impressions(展现)
缺点:点击受到用户浏览行为的影响;对于长尾query和ad,存在冷启动问题。
2. 点击模型:a unified framework——实际上是把各个因素罗列出来
u -- user
q -- query
a -- ad
r -- position of ad
c -- click, 1 if a is clicked by u
L -- the impression list
S -- the click sequence
点击模型的任务就是通过用户的点击日志来预测广告的未来点击,形式化的说,就是在未来的展现中,计算 P(c=1| q,a,u,r,L,S)的值
3. 点击模型的不同层次的假设
(1)unbiased hypothesis: P(c | q,a,u,r,L,S) = P(c|q,a)
(2)position bias hypothesis: P(c | q,a,u,r,L,S) = P(c|q,a,r)
(3)depend on click pattern: P(c | q,a,u,r,L,S) = P(c|q,a,r,S)
(4)depend on ad externality: P(c | q,a,u,r,L,S) = P(c|q,a,r,L)
(5)depend on user intent: P(c | q,a,u,r,L,S) = P(c|q,a,u,r)
展开来说:
3 - 1:unbiased hypothesis
点击只和query以及广告自身有关,不考虑任何因素
3 - 2:position bias hypothesis
examination hypothesis:将用户的examine的过程考虑进来,将“用户点击”这个事件分解为两个事件,即“用户examine”和“用户点击”。在此基础上,概率分解:
P(c|q,a,r) = P(e=1|r) * P(c=1|q,a,e=1)
其中,P(e=1|r) 表示在位置r,用户查看(examine)的概率。可以通过跟踪人眼盯在屏幕上的位置(热度)来获得;也可以通过将相同的ad放在不同的位置,来计算点击率获得,不过这种方法貌似代价比较大。
3 - 3:depend on click pattern
看这个ppt的感觉就是,模型越用越复杂,怀疑在实际中真的有用么?
cascade hypothesis(wsdm08):是examination hypothesis的进一步深化,即在examination hypothesis的基础上,进一步假设用户是顺序examine ad的,并把这种检查顺序放到了条件概率里面
multiple-click model(wsdm09):在cascade hypothesis的基础上融合了用户的多次点击,隐含假设是,在一个结果列表中,用户通常要通过多次点击来完成需求满足。具体做法上,对于某个ad,将用户点击和非点击的概率线性插值起来,整体做法上还是类似cascade hypothesis的。
DBN(wsdm09):套用DBN来对用户examine和点击进行建模
上面三种方法,实验结果中,貌似DBN最好,不过,看到logistic作为baseline,也不差
3 - 4:depend on ad externality
这个假设,将ad列表中ad之间的关系也建模进去了,貌似更加脱离实际应用。
temporal click model(sigir09):关键假设是,一个ad如果和更高质量的ad放在一起展示,那么这个ad的点击率会下降。用graph model来描述这种关系。
relational click predication(wsdm12):关键假设,展示的ad列表,ad之间的相似程度会影响ad的点击率。作法,将ad列表作为一个整体对待,而不是针对每个ad进行分别对待,用crf来描述。
3 - 5:depend on user intent
task centric click model(kdd11):关键假设,用户逐渐精细化的表述他的需求(通过越来越精确的query),并且倾向于点击不在从前query中出现的文档(新文档)。用graph model来做的。
相关文章推荐
- 【点击模型学习笔记】Inferring clickthrough rates on ads from click behavior on search results_wsdm2011
- 【点击模型学习笔记】Modeling contextual factors of click rates_MS_AAAI2007
- 【点击模型学习笔记】Predicting Clicks_Estimating the Click-Through Rate for New Ads_MS_www2007
- 【点击模型学习笔记】Ad centric model discovery for redicting ads' click through rate_ANT2013_Tencent
- 【点击模型学习笔记】Predicting Clicks_Estimating the Click-Through Rate for New Ads_MS_www2007
- 韩顺平_php从入门到精通_视频教程_第14讲_盒子模型经典应用②_作业布置_学习笔记_源代码图解_PPT文档整理
- 前端攻城狮学习笔记四:点击ul下的li时alert其index值(闭包的应用)
- 微软的一篇ctr预估的论文:Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft’s Bing Search Engine。
- 论文阅读笔记:Threat of Adversarial Attacks on Deep Learning in Computer Vision: A Survey
- iOS9-by-Tutorials-学习笔记三:Your-App-on-the-Web
- [学习笔记]Disable Auto Zoom in Input “Text” tag - Safari on iPhone
- [论文笔记]Learning Deep Structured Semantic Models for Web Search using Clickthrough Data
- Spring MVC学习笔记:web.xml中load-on-startup的作用
- 韩顺平_php从入门到精通_视频教程_第13讲_选择器使用细节_块元素和行内元素_盒子模型_盒子模型经典应用①_学习笔记_源代码图解_PPT文档整理
- Spring MVC学习笔记:web.xml中load-on-startup的作用
- Learning Deep Structured Semantic Models for Web Search using Clickthrough Data笔记
- Thinking in UML 学习笔记(一)——建立对象模型
- [学习笔记][ASP.NET2.0][点击asp:Button出现两次提交数据的问题][解决:去掉OnClick或者OnCommand属性]
- Thinking in UML 学习笔记(一)——建立对象模型
- 【点击模型学习笔记】广告点击率估算技术综述_华东师范大学学报2013