轻量级的网页Rank算法,365Rss.cn的Rank技术解释以及算法讨论(一)
2007-01-08 00:34
357 查看
写这片文章,是想讨论一下轻量级(相对于Google那种重型复杂的PageRank而言)的网页Rank算法。
一般而言,一个网页是否受欢迎,365Rss.cn所能想到的,应该涉及到3个分子因素:“点击量”、“回复量”、“用户评分”。
注:“分子因素”是我自己想的名词,也即作为被除数的因素。它的数学名词大学教过我忘了。
目前大部分国内站点都片面地关注并在数据库里面记录了以上3个因素。但是很少有网站把这些因素综合起来进行数据挖掘、分析。365Rss.cn在一开始设计的时候就考虑到这3点因素,并设计了各自的权重。
一个网页满分100分。其中:
点击量=20%
回复量=30%
用户评分=50%
计算Rank的时候,365Rss.cn还为“点击量”、“回复量”考虑到了一个分母因素:“网页年龄”。
注:“分母因素”是我自己想的名词,也即作为除数的因素。
为什么不为“用户评分”考虑网页年龄呢,因为一般而言,用户打分后的平均分,并不因为该网页存在的时间长短而成比例。相反,一定时间内的点击和回复率,往往很大程度上决定该网页是否受欢迎。
Rank计算公式如下:
Rank=(用户评分总数/打分次数)*50 +(回复量/网页年龄)*e*30+(点击量/网页年龄)*e*20
注:该公式的e为一个协调常数,具体数字是多少365Rss.cn小组暂未定。
今天太晚了,下次讲365Rss.cn网站采用的改进型轻量级Rank算法。
一般而言,一个网页是否受欢迎,365Rss.cn所能想到的,应该涉及到3个分子因素:“点击量”、“回复量”、“用户评分”。
注:“分子因素”是我自己想的名词,也即作为被除数的因素。它的数学名词大学教过我忘了。
目前大部分国内站点都片面地关注并在数据库里面记录了以上3个因素。但是很少有网站把这些因素综合起来进行数据挖掘、分析。365Rss.cn在一开始设计的时候就考虑到这3点因素,并设计了各自的权重。
一个网页满分100分。其中:
点击量=20%
回复量=30%
用户评分=50%
计算Rank的时候,365Rss.cn还为“点击量”、“回复量”考虑到了一个分母因素:“网页年龄”。
注:“分母因素”是我自己想的名词,也即作为除数的因素。
为什么不为“用户评分”考虑网页年龄呢,因为一般而言,用户打分后的平均分,并不因为该网页存在的时间长短而成比例。相反,一定时间内的点击和回复率,往往很大程度上决定该网页是否受欢迎。
Rank计算公式如下:
Rank=(用户评分总数/打分次数)*50 +(回复量/网页年龄)*e*30+(点击量/网页年龄)*e*20
注:该公式的e为一个协调常数,具体数字是多少365Rss.cn小组暂未定。
今天太晚了,下次讲365Rss.cn网站采用的改进型轻量级Rank算法。
相关文章推荐
- 转 Adaboost算法的另一种解释以及前向算法介绍
- 目前,目标跟踪技术主要应用于以下领域: 以及各种跟踪算法的简介
- 轻量级网页客户端矢量图形绘制技术总结(lightweight techniques for online drawing)
- Chrome浏览器网页截全屏算法以及实现
- 尽管关于Java中文问题的讨论已经相当多了,但由于Java的相关技术标准繁多,面向Java的Web服务器、应用服务器以及JDBC数据库驱动等都没有官方的标准,所以Java应用在处理中文时所存在的问
- [原创]利用爬虫技术获取网页数据,以及想要的指定数据
- 网页漂浮层的例子以及相关解释
- DEM山体阴影原理以及算法具体解释
- [技术讨论]架构设计和代码之间的关系以及程序员任务安排
- 搜索引擎复制网页的算法和重复网页发现技术分析
- c++实现加密和解密算法以及JNI技术的应用实例
- 本周末开源活动(北京):About Apache Meet Up Beijing(开源committers, developers 以及users聚集在一起讨论技术,用例等)
- 网页抽取技术和算法
- 【摘抄】百度分词算法详解:查询处理以及分词技术
- 窗体、滚动条宽度和高度获取以及document.body和document.documentElement,document.compatMode解释(网页高度宽度)
- 自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索、推荐以及算法相关工作。多年来主要从事推荐系统以及机
- 基于Spark的移动用户主要活动地点的挖掘算法实现以及JavaEE技术整合
- 高手收集整理的baidu分词算法分析之一 查询处理以及分词技术(1)
- 梯度优化算法总结以及solver及train.prototxt中相关参数解释
- 读取一串整数,寻找合适的数据结构和算法,实现插入元素track(int x) 方法,以及GetRankOfNumber(int x)方法,返回值为小于等于x的元素个数(不包括x本身)