读书笔记-集体智慧编程
2018-03-04 16:57
162 查看
不定时更新 2018.3.26
一、推荐
相关性评价方法:
欧氏距离、皮尔逊评价
对于稀疏数据集,基于物品的过滤要优于基于用户的过滤
二、聚类
tanimoto系数可用来评价两组只包含0、1数据的距离,它代表交集和并集的比率
三、搜索与排名
爬取网页(urllib2)- 连接数据库(pysqlite2)- 建立索引数据表-网页源码分词 - 利用单词建立索引 - 利用单词频度、文档位置、单词距离进行排名
使用pagerank改善搜索结果
一、推荐
相关性评价方法:
欧氏距离、皮尔逊评价
对于稀疏数据集,基于物品的过滤要优于基于用户的过滤
二、聚类
tanimoto系数可用来评价两组只包含0、1数据的距离,它代表交集和并集的比率
三、搜索与排名
爬取网页(urllib2)- 连接数据库(pysqlite2)- 建立索引数据表-网页源码分词 - 利用单词建立索引 - 利用单词频度、文档位置、单词距离进行排名
使用pagerank改善搜索结果
相关文章推荐
- 《programming.collective.intelligence》(集体智慧编程)读书笔记
- 集体智慧编程 读书笔记 一
- 【转】读书笔记:“集体智慧编程”之第二章:推荐算法——协同滤波
- 集体智慧编程 读书笔记 三
- 集体智慧编程 读书笔记 二
- 算法总结(集体编程智慧) - 分类
- 关于《programming collective intelligence》(集体智慧编程)的del.icio.us API无法访问
- 读集体编程智慧所感
- 集体编程的智慧下载(超高清版+源代码)
- 集体智慧编程 英文版
- 集体智慧编程——搜索与排名-Python实现
- 集体智慧编程——优化搜索算法:爬山法,模拟退火算法,遗传算法-Python实现
- 集体智慧编程----第二章 提供推荐(Making Recommendations)
- 集体智慧编程的笔记
- “集体智慧编程”之第三章:“发现群组”的 列聚类
- 集体智慧编程学习笔记--文档过滤
- 集体智慧编程第四章[搜索引擎与排名]总结
- 集体智慧编程-K均值聚类代码理解
- 算法总结(集体编程智慧) - 聚类、优化
- 集体智慧编程--推荐系统