Lucene 3.5 提供深度分页支持 searchAfter方法 方法的应用
2013-03-28 14:01
399 查看
/article/4987535.html
最近Lucene项目管理委员会宣布Apache Lucene 3.5.0和Apache Solr 3.5.0已经可以使用。Lucene是一个高性能、支持全文搜索的文本搜索开发库。Solr是一个独立的搜索服务器,其核心使用了Lucene来做索引和搜索。
Lucene 3.5其中一个最新的特征就是深度分页支持,在之前的版本是提供分页的方法,只能根据自己的应用场景去写分页的方法!在《lucene in action》一书中提现两种分页的方法:1、将首次搜索获得的多页搜索结果收集起来并保存在ScoreDocs和IndexSearcher实例中,并在用户换页浏览时展现这几页的结果。
2、每次用户换页浏览时都重新进行查询操作。
按这两个方法是可以做出分页的,只是效果及性能影响大小而已!
现在Lucene 3.5 加入IndexSearcher.searchAfter方法,它在特定的ScoreDoc之后会返回结果。你可以将上一页的最后一个document传递给searchAfter方法,以得到下一页的结果。
实例如下:
View Code
Lucene 3.5 在学习中,请多多指教!呵呵!
记住该记住的,忘记该忘记的,改变能改变的,接受不能改变的!
最近Lucene项目管理委员会宣布Apache Lucene 3.5.0和Apache Solr 3.5.0已经可以使用。Lucene是一个高性能、支持全文搜索的文本搜索开发库。Solr是一个独立的搜索服务器,其核心使用了Lucene来做索引和搜索。
Lucene 3.5其中一个最新的特征就是深度分页支持,在之前的版本是提供分页的方法,只能根据自己的应用场景去写分页的方法!在《lucene in action》一书中提现两种分页的方法:1、将首次搜索获得的多页搜索结果收集起来并保存在ScoreDocs和IndexSearcher实例中,并在用户换页浏览时展现这几页的结果。
2、每次用户换页浏览时都重新进行查询操作。
按这两个方法是可以做出分页的,只是效果及性能影响大小而已!
现在Lucene 3.5 加入IndexSearcher.searchAfter方法,它在特定的ScoreDoc之后会返回结果。你可以将上一页的最后一个document传递给searchAfter方法,以得到下一页的结果。
实例如下:
View Code
1 @Override 2 public List<BlogsDO> searchBlogsList(String content,String bTypeId,String sDate,String eDate,Page page) throws IOException, ParseException { 3 List<BlogsDO> blogList=new ArrayList<BlogsDO>() ; 4 // TODO Auto-generated method stub 5 TokenStream tokenStream=null; 6 try{ 7 analyzer = new IKAnalyzer(); 8 //获取IndexSearcher 对象 9 IndexSearcher indexSearch =commonIndexWriter.getIndexSearcher(); 10 QueryParser queryParser= commonIndexWriter.getQueryParser(); 11 //搜索条件的结合 12 String str=""; 13 if(StringUtils.isNotEmpty(content)){ 14 str="title:"+content+" content:"+content; 15 } 16 if(StringUtils.isNotEmpty(bTypeId) && !bTypeId.equals("-1")){ 17 if(StringUtils.isNotEmpty(str)){ 18 str=str+" AND bTypeId:"+bTypeId; 19 }else{ 20 str=str+" bTypeId:"+bTypeId; 21 } 22 } 23 if(StringUtils.isNotEmpty(sDate)){ 24 if(StringUtils.isNotEmpty(str)){ 25 str=str+" AND gmt_create:["+sDate+" TO "+eDate+"]"; 26 }else{ 27 str=str+" gmt_create:["+sDate+" TO "+eDate+"]"; 28 } 29 } 30 //设置搜索条件 31 Query query=queryParser.parse(str); 32 //查询搜索引擎 33 TopDocs result = indexSearch.search(query, 10); 34 //上一页的最后一个document索引 35 int index=(page.getCurrentPage()-1)*page.getPerPageSize(); 36 ScoreDoc scoreDoc=null; 37 //如果当前页是第一页面scoreDoc=null。 38 if(index>0){ 39 //因为索引是从0开始所以要index-1 40 scoreDoc=result.scoreDocs[index-1]; 41 } 42 //分页处理 43 TopDocs hits= indexSearch.searchAfter(scoreDoc, query, page.getPerPageSize()); 44 //设置分页的总记录数 45 page.setCounts(hits.totalHits); 46 BlogsDO blog=null; 47 //循环hits.scoreDocs数据,并使用indexSearch.doc方法把Document还原,再拿出对应的字段的值 48 for (int i = 0; i < hits.scoreDocs.length; i++) { 49 ScoreDoc sdoc = hits.scoreDocs[i]; 50 Document doc = indexSearch.doc(sdoc.doc); 51 blog=new BlogsDO(); 52 String title=doc.get("title"); 53 String mark=doc.get("content"); 54 //加亮处理 55 SimpleHTMLFormatter simplehtml=new SimpleHTMLFormatter("<font color='red'>", "</font>"); 56 Highlighter highlighter = new Highlighter(simplehtml,new QueryScorer(query)); 57 if(title!=null){ 58 tokenStream = analyzer.tokenStream("title",new StringReader(title)); 59 String highLightText = highlighter.getBestFragment(tokenStream, title); 60 blog.setTitle(highLightText==null?title:highLightText); 61 }else{ 62 blog.setTitle(title); 63 } 64 //加亮处理 65 if(mark!=null){ 66 tokenStream = analyzer.tokenStream("content",new StringReader(mark)); 67 String highLightText = highlighter.getBestFragment(tokenStream, mark); 68 blog.setContent(highLightText==null?mark:highLightText); 69 }else{ 70 blog.setContent(mark); 71 } 72 blog.setBlogsId(Integer.valueOf(doc.get("blogsId"))); 73 blog.setNickName(doc.get("nickName")); 74 blog.setbTypeId(doc.get("bTypeId")); 75 blog.setbTypeName(doc.get("bTypeName")); 76 blog.setRevDate(doc.get("gmt_create")); 77 SimpleDateFormat sdf = new SimpleDateFormat("yyyyMMddHHmmss"); 78 blog.setGmtCreate(sdf.parse(doc.get("gmt_create"))); 79 blogList.add(blog); 80 } 81 indexSearch.close(); 82 }catch (java.text.ParseException e) { 83 // TODO Auto-generated catch block 84 e.printStackTrace(); 85 }catch (InvalidTokenOffsetsException e) { 86 // TODO Auto-generated catch block 87 e.printStackTrace(); 88 } 89 return blogList;
Lucene 3.5 在学习中,请多多指教!呵呵!
记住该记住的,忘记该忘记的,改变能改变的,接受不能改变的!
相关文章推荐
- Lucene 3.5 提供深度分页支持 searchAfter方法 方法的应用
- Lucene 3.5 提供深度分页支持 searchAfter方法 方法的应用
- Lucene 3.5和Solr 3.5:大幅降低内存用量、SearcherManager和深度分页支持
- Lucene的深度分页支持
- Android官方提供的支持不同屏幕大小的全部方法
- 【又拍图片相册跨分页下载图片/本地图片】合并及文字水印——淘宝开店过程中的技术应用【提供源代码下载】
- Android官方提供的支持不同屏幕大小的全部方法
- 为iOS应用提供技术支持
- 基于Lucene对少量新闻(5000篇左右)应用TFIDF方法进行关键字抽取与建立索引、检索
- 转 ofbiz的webservice接口提供(4)-支持复杂数据类型方法
- iOS 32位、 64位系统兼容性设置-Xcode创建支持IOS4.3以上版本的应用的方法
- [Android实践]之:Android官方提供的支持不同屏幕大小的全部方法
- Android官方提供的支持不同屏幕大小的全部方法
- Android应用多语言支持实现(方法一)
- IntelliJ IDEA:给 web 应用提供 JSTL 支持
- Android官方提供的支持不同屏幕大小的全部方法
- 分页存储过程(支持多字段排序)及调用& output多参数存储过程调用应用
- grails中的动态方法查询提供分页设置
- Android官方提供的支持不同屏幕大小的全部方法
- Android官方提供的支持不同屏幕大小的全部方法