搜索中客户的访问日志到底能用来做什么(6)?
2013-11-30 10:01
239 查看
想到哪写到哪吧,如果看的有点乱请包涵
访问日志的扩展功能
说的再多我们仍是围绕用户的访问日志,
先举个百度指数的例子,下图为百度指数查询李天一
我们可以看到用户关注度这个趋势图,那么这个是怎么得到的呢?
其实用户的搜索均会有日志,只需要而将这些查询词与访问点击保存即可,(可以用很多种方式保存,不过我估计是采用hbase来存的);同时针对(热点)查询词进行归一化(意思是查的本来是一个词,只是表述不一样,这样的话就不需要各自存储了,例如现在查李天一,李某某,其实估计表示为一个人)来减少存储开销,这样所谓的指数不就完成了吗。
所以从这个日志中我们可以给出任意的指数,而且可以是精准的定制化指数
待续
访问日志的扩展功能
说的再多我们仍是围绕用户的访问日志,
先举个百度指数的例子,下图为百度指数查询李天一
我们可以看到用户关注度这个趋势图,那么这个是怎么得到的呢?
其实用户的搜索均会有日志,只需要而将这些查询词与访问点击保存即可,(可以用很多种方式保存,不过我估计是采用hbase来存的);同时针对(热点)查询词进行归一化(意思是查的本来是一个词,只是表述不一样,这样的话就不需要各自存储了,例如现在查李天一,李某某,其实估计表示为一个人)来减少存储开销,这样所谓的指数不就完成了吗。
所以从这个日志中我们可以给出任意的指数,而且可以是精准的定制化指数
待续
相关文章推荐
- 搜索中客户的访问日志到底能用来做什么(8)?
- 搜索中客户的访问日志到底能用来做什么(2)?
- 搜索中客户的访问日志到底能用来做什么(3)?
- 搜索中客户的访问日志到底能用来做什么(5)?
- 搜索中客户的访问日志到底能用来做什么(1)?
- 搜索中客户的访问日志到底能用来做什么(4)?
- 搜索中客户的访问日志到底能用来做什么(7)?
- Windows服务安装异常:System.Security.SecurityException: 未找到源,但未能搜索某些或全部事件日志。不可 访问的日志: Security
- nginx前端,tomcat后端服务器获取客户的真实IP,包括tomcat访问日志获取真实IP的配置
- Win10应用更新开始提供日志 能知道到底升级了什么内容
- System.Security.SecurityException: 未找到源,但未能搜索某些或全部事件日志。不可访问的日志: Security。
- 【已解决】Windows Service服务 出现System.Security.SecurityException: 未找到源,但未能搜索某些或全部事件日志。不可访问的日志: Security。
- IT运维分析与海量日志搜索需要注意什么
- 通过浏览器访问一个网站的背后到底经历了什么
- 浏览器访问一个网站的背后到底经历了什么?
- 博客到底是用来干什么的?
- System.Security.SecurityException: 未找到源,但未能搜索某些或全部事件日志。不可访问的日志: Security。
- 客户到底想要什么?
- 信息熵(Entropy)到底是用来衡量什么的?
- Python那么火,到底能用来做什么?我们来说说Python3的主要应用