发布全文检索类库外包
2010-07-09 14:32
141 查看
因时间紧张,现将全文检索类库外包,需求如下,有意者可详细沟通。
全文检索类库需求说明
操作系统环境:
Windows 2003 + IIS 6
IDE开发环境:
VS 2008 + C# 3.5 + lucene.net (或者其他)
技术要求:
符合高并发需求,可满足同时300以上个搜索的请求(内存,IO,通讯传输量)。
读写分离策略(可以采用队列 + 定时器的模式更新索引)
更新策略,与上面相同,可以有一天的延迟。
中英文分词
避免大量的 IO,可以采取适当的缓存技术,网站有分布式缓存,最好一个文件块每天只发起一次 IO。
排序策略:排序策略有多种因子,排序因子可调
按相关性搜索排序之后,还会有对站内积分规则的二次排序过滤。
搜索策略,可拓展搜索接口。
避免内存泄露问题
需求说明:
全文检索只需要提供相应的接口和策略,操作到指定的文件块即可。
全文检索共分为三块业务:
产品的搜索,带有商户和产品的排序策略,产品的显示和搜索都从全文库发起。
帮助的搜索,英文帮助和中文帮助的搜索,这两块部分都不是很大,可以直接缓存。
中文,英文分词
索引库在单独的服务器,多个 WEB 服务器对索引库服务器请求搜索,服务器在一个局域网内,光纤网卡连接。
全文检索类库需求说明
操作系统环境:
Windows 2003 + IIS 6
IDE开发环境:
VS 2008 + C# 3.5 + lucene.net (或者其他)
技术要求:
符合高并发需求,可满足同时300以上个搜索的请求(内存,IO,通讯传输量)。
读写分离策略(可以采用队列 + 定时器的模式更新索引)
更新策略,与上面相同,可以有一天的延迟。
中英文分词
避免大量的 IO,可以采取适当的缓存技术,网站有分布式缓存,最好一个文件块每天只发起一次 IO。
排序策略:排序策略有多种因子,排序因子可调
按相关性搜索排序之后,还会有对站内积分规则的二次排序过滤。
搜索策略,可拓展搜索接口。
避免内存泄露问题
需求说明:
全文检索只需要提供相应的接口和策略,操作到指定的文件块即可。
全文检索共分为三块业务:
产品的搜索,带有商户和产品的排序策略,产品的显示和搜索都从全文库发起。
帮助的搜索,英文帮助和中文帮助的搜索,这两块部分都不是很大,可以直接缓存。
中文,英文分词
索引库在单独的服务器,多个 WEB 服务器对索引库服务器请求搜索,服务器在一个局域网内,光纤网卡连接。
相关文章推荐
- 搜索系统:全文检索(lucene、排序、多域搜索、高亮、分页、监听器)
- 全文检索引擎Solr系列—–全文检索基本原理
- 使用PostgreSQL进行中文全文检索
- 基于sql-server 的全文检索
- postgresql全文检索语法
- 在sqlserver中建全文检索
- flex中实现全文检索中的高亮显示
- 全文本检索的应用
- 结合SQL Server全文检索对Word内容进行检索的三个方案
- Solr全文检索服务器搭建与基本使用介绍
- Solr全文检索服务器搭建与基本使用介绍
- 全文检索引擎Solr系列—–全文检索基本原理
- 全文检索技术介绍与使用方法
- 堆结构在全文检索中的应用
- oracle 全文检索
- Lucene作为一个全文检索引擎
- hdu 1277 全文检索(AC自动机)
- Lucene:实现数据库的全文检索
- 深度解析MySQL 5.7之中文全文检索
- 在应用中加入全文检索功能——基于Java的全文索引引擎Lucene简介