Mahout基于对数似然比更好的计算相似度
2015-05-27 20:31
204 查看
//基于对数似然比更好的计算相似度(量用户) //所谓对数似然比为选取两个用户进行比较的时后进行筛选 //相似性为可以解释为发生重叠为发生重叠的非偶然概率 package byuser; import java.io.File; import java.io.IOException; import org.apache.mahout.cf.taste.common.TasteException; import org.apache.mahout.cf.taste.eval.RecommenderBuilder; import org.apache.mahout.cf.taste.eval.RecommenderEvaluator; import org.apache.mahout.cf.taste.impl.eval.AverageAbsoluteDifferenceRecommenderEvaluator; import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood; import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender; import org.apache.mahout.cf.taste.impl.similarity.CachingUserSimilarity; import org.apache.mahout.cf.taste.impl.similarity.LogLikelihoodSimilarity; import org.apache.mahout.cf.taste.model.DataModel; import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood; import org.apache.mahout.cf.taste.recommender.Recommender; import org.apache.mahout.cf.taste.similarity.UserSimilarity; import org.apache.mahout.cf.taste.similarity.precompute.example.GroupLensDataModel; public class LogLikelihoodSimailarirtyTest { DataModel model; public LogLikelihoodSimailarirtyTest() throws IOException, TasteException{ DataModel model = new GroupLensDataModel(new File("E:\\mahout项目\\examples\\ratings.dat")); RecommenderEvaluator evaluator = new AverageAbsoluteDifferenceRecommenderEvaluator(); RecommenderBuilder recommenderBuilder = new RecommenderBuilder() { @Override public Recommender buildRecommender(DataModel model) throws TasteException { UserSimilarity similarity = new CachingUserSimilarity(new LogLikelihoodSimilarity(model), model); UserNeighborhood neighborhood = new NearestNUserNeighborhood(100, similarity, model); return new GenericUserBasedRecommender(model, neighborhood, similarity); } }; double score = evaluator.evaluate(recommenderBuilder, null, model, 0.95, 0.05); System.out.println("采用对数似然比的推荐引擎的评测得分是: " + score); } public static void main(String[] args) throws IOException, TasteException { // TODO Auto-generated method stub LogLikelihoodSimailarirtyTest ls = new LogLikelihoodSimailarirtyTest(); } }
如图:
相关文章推荐
- win7基于mahout推荐之用户相似度计算
- Mahout-DistanceMeasure (相似度计算)
- 转 基于推理和相似度计算的语义W eb服务匹配策略
- 对“基于语义依存的汉语句子相似度计算”的优化。
- Mahout中相似度计算方法介绍
- Mahout中相似度距离计算方法总结
- MAHOUT文本向量相似度计算
- 基于向量余弦的文件相似度计算
- hadoop Mahout中相似度计算方法介绍(转)
- [推荐系统]mahout中实现的几种相似度计算方法
- [推荐系统]Mahout中相似度计算方法介绍
- 基于Map-Reduce的相似度计算
- WMD:基于词向量的文档相似度计算
- 分享:基于MinHash的集合相似度计算原理
- 一个基于特征向量的近似网页去重算法——term用SVM人工提取训练,基于term的特征向量,倒排索引查询相似文档,同时利用cos计算相似度
- Mahout的taste里的几种相似度计算方法
- Mahout的taste里的几种相似度计算方法
- [面试备忘]计算字符串相似度 & 无头单链删非头尾节点 & 基于前续中续重建二叉树
- 基于VSM计算相似度(含Python代码)
- Mahout中相似度计算方法介绍