一种读者图书借阅二分网络中的优质图书迭代识别算法
2012-10-20 07:31
218 查看
为了给图书馆读者用户提供更满意的个性化推荐图书,我们必须在两方面做出有效的工作:一是如何来准确的识别用户可能感兴趣的图书主题或者类别,不像图书,读者用户一般没有完整直接的兴趣特征标识。常用的方法往往是采用读者所借图书的主题信息来间接表达读者的兴趣特征,然而我们也注意到,读者在借阅时并非始终对某种既定主题保持着浓厚的兴趣,有时也因为能力和专业水平的差距,大量的所借图书可能并非自己最终所要的图书,甚至还有可能借到一些质量并不高的相关图书。这些图书在很大程度上并不能很好的代表着用户的兴趣特征,因此直接利用所借图书的主题信息来间接识别读者信息存在着需要改进的环节;二是如何有效识别不同图书的质量,从而为读者推荐更可能使其满意的图书。传统的方法一般借助于借阅量这个指标,也就是说那些被更多人所借的图书通常也可能会被当前用户所借阅,然而我们认为具有较高专业知识背景的读者应该比一般随便借阅的读者对所借图书具有更高的认可能力,所以传统做法显然忽略了不同读者对自己所借图书的不同推荐能力。同时,由于读者兴趣的广泛性,使得某些专业性较强的图书一般在借阅量上极大的低于某些通俗类图书,这也从另一方面给以单纯使用借阅量为主的推荐方法带来不利影响。
从一定程度上讲,上述第二个问题的解决方法也有助于对第一个问题的解决,正是我们无法探知图书的真正质量所以我们无法准确的从现有的读者借阅信息中识别出最有价值的所借图书信息。
基于该算法,可以提出三种可以应用在个性化图书服务中的推荐模式,分别是特定主题的图书推荐、现有所借图书的修正型推荐和新书推荐。测试网址为:http://www.njmars.net:8088/libs。
一)特定主题的图书推荐实验结果
我们对常见的几种图书类别和关键词进行了查询测试,实验表明对于某主题领域下的高质量图书而言,本文所设计的方法能够比简单借助借阅量方法,对于专业性较强的图书,具有更好的识别效果,尤其在某个特定的主题领域所涉及的图书总数不多的情况,更易于发现该主题领域的高质量图书。
[align=center]“信息检索”主题相关的图书推荐结果截图[/align]
二)现有所借图书的修正型推荐实验结果
如对“搜索引擎”相关图书而言,我们得到了5条初始图书记录,如果选中第一本《搜索引擎广告:网络营销的成功之路》,并将调节参数设定为8,即表示只取标题相似度最高的前8本图书,得到的修正型推荐结果皆与搜索引擎和广告营销密切相关
与搜索引擎和广告营销密切相关“搜索引擎”推荐结果截图
而如果选中第四本《搜索引擎与信息获取技术》,则获得的修正型推荐结果完全和前者不一样,更侧重于搜索引擎技术方面的介绍
[align=center]与搜索引擎技术密切相关“搜索引擎”推荐结果截图[/align]
三)新书推荐实验结果
在实验中,我们仅对读者用户进行了用户个性化模式的表达能力测试。如“A023”读者,该读者共有226条借阅记录,在按照新书推荐算法得到的相关读者兴趣模式中,主要的读者兴趣特征有“TP311”类和“TP312”类等,其中每个最能反映用户兴趣特征的关键词
读者“A023”的用户个性化模式的展示效果截图
从一定程度上讲,上述第二个问题的解决方法也有助于对第一个问题的解决,正是我们无法探知图书的真正质量所以我们无法准确的从现有的读者借阅信息中识别出最有价值的所借图书信息。
基于该算法,可以提出三种可以应用在个性化图书服务中的推荐模式,分别是特定主题的图书推荐、现有所借图书的修正型推荐和新书推荐。测试网址为:http://www.njmars.net:8088/libs。
一)特定主题的图书推荐实验结果
我们对常见的几种图书类别和关键词进行了查询测试,实验表明对于某主题领域下的高质量图书而言,本文所设计的方法能够比简单借助借阅量方法,对于专业性较强的图书,具有更好的识别效果,尤其在某个特定的主题领域所涉及的图书总数不多的情况,更易于发现该主题领域的高质量图书。
[align=center]“信息检索”主题相关的图书推荐结果截图[/align]
二)现有所借图书的修正型推荐实验结果
如对“搜索引擎”相关图书而言,我们得到了5条初始图书记录,如果选中第一本《搜索引擎广告:网络营销的成功之路》,并将调节参数设定为8,即表示只取标题相似度最高的前8本图书,得到的修正型推荐结果皆与搜索引擎和广告营销密切相关
与搜索引擎和广告营销密切相关“搜索引擎”推荐结果截图
而如果选中第四本《搜索引擎与信息获取技术》,则获得的修正型推荐结果完全和前者不一样,更侧重于搜索引擎技术方面的介绍
[align=center]与搜索引擎技术密切相关“搜索引擎”推荐结果截图[/align]
三)新书推荐实验结果
在实验中,我们仅对读者用户进行了用户个性化模式的表达能力测试。如“A023”读者,该读者共有226条借阅记录,在按照新书推荐算法得到的相关读者兴趣模式中,主要的读者兴趣特征有“TP311”类和“TP312”类等,其中每个最能反映用户兴趣特征的关键词
读者“A023”的用户个性化模式的展示效果截图
相关文章推荐
- 用BP网络算法实现对含噪声0到9数字的识别
- NN:神经网络算法进阶优化法,进一步提高手写数字识别的准确率—Jason niu
- 计算机视觉中经常需要识别或者定位某些几何图形,比如直线、圆、椭圆,还有其他一些图形。检测直线的霍夫变换提供了在图像中寻找直线的一种算法,是最简单的一种情形,后来发展到检测圆、椭圆、还有一般图形的霍夫变
- 一种精确的基于DHT的p2p网络搜索算法与网络拓扑模型
- UOJ#9 浅谈在线仙人球嵌套动态网络路径剖分优化的分支定界贪心剪枝启发式迭代加深人工智能搜索决策算法解决问题
- 一种修正观测分布的迭代算法
- 新颖训练方法——用迭代投影算法训练神经网络
- 利用神经网络算法的C#手写数字识别
- PK/NN/*/SVM:实现手写数字识别(数据集50000张图片)比较3种算法神经网络、灰度平均值、SVM各自的准确率—Jason niu
- ICPR MTWI 2018 挑战赛三:网络图像的端到端文本检测和识别算法架构
- 用BP网络算法实现对含噪声0到9数字的识别
- 折半查找,也称二分查找、二分搜索,是一种在有序数组中查找某一特定元素的搜索算法。
- 神经进化:一种不一样的深度学习——通过进化算法来探求神经网络的进化
- CNN:人工智能之神经网络算法进阶优化,六种不同优化算法实现手写数字识别逐步提高,应用案例自动驾驶之捕捉并识别周围车牌号—Jason niu
- Adaboost分类器是一种迭代算法
- Ajax in Action被Amazon评为2006年最受读者喜爱的计算机及网络类图书第一名
- 霍夫变换的原理 及 一种参数迭代的自适应寻找最佳霍夫直线的代码(在条码识别中的应用)
- 一种精确的基于DHT的p2p网络搜索算法与网络拓扑模型
- 一种基于迭代与分类识别方法的入门级Python爬虫
- 手把手实战:利用LM神经网络算法自动识别窃电用户(附代码)