您的位置:首页 > 其它

Lucene 3.5 提供深度分页支持 searchAfter方法 方法的应用

2013-03-28 14:01 399 查看
/article/4987535.html

      最近Lucene项目管理委员会宣布Apache Lucene 3.5.0和Apache Solr 3.5.0已经可以使用。Lucene是一个高性能、支持全文搜索的文本搜索开发库。Solr是一个独立的搜索服务器,其核心使用了Lucene来做索引和搜索。

Lucene 3.5其中一个最新的特征就是深度分页支持,在之前的版本是提供分页的方法,只能根据自己的应用场景去写分页的方法!在《lucene in action》一书中提现两种分页的方法:1、将首次搜索获得的多页搜索结果收集起来并保存在ScoreDocs和IndexSearcher实例中,并在用户换页浏览时展现这几页的结果。

     2、每次用户换页浏览时都重新进行查询操作。

按这两个方法是可以做出分页的,只是效果及性能影响大小而已!

     现在Lucene 3.5 加入IndexSearcher.searchAfter方法,它在特定的ScoreDoc之后会返回结果。你可以将上一页的最后一个document传递给searchAfter方法,以得到下一页的结果。

     实例如下:


View Code




1 @Override
2     public List<BlogsDO> searchBlogsList(String content,String bTypeId,String sDate,String eDate,Page page) throws IOException, ParseException {
3         List<BlogsDO> blogList=new ArrayList<BlogsDO>() ;
4         // TODO Auto-generated method stub
5          TokenStream tokenStream=null;
6          try{
7                 analyzer = new IKAnalyzer();
8                 //获取IndexSearcher 对象
9                 IndexSearcher indexSearch =commonIndexWriter.getIndexSearcher();
10                 QueryParser queryParser= commonIndexWriter.getQueryParser();
11                 //搜索条件的结合
12                 String str="";
13                 if(StringUtils.isNotEmpty(content)){
14                     str="title:"+content+" content:"+content;
15                 }
16                 if(StringUtils.isNotEmpty(bTypeId) && !bTypeId.equals("-1")){
17                    if(StringUtils.isNotEmpty(str)){
18                      str=str+" AND bTypeId:"+bTypeId;
19                    }else{
20                      str=str+" bTypeId:"+bTypeId;
21                    }
22                 }
23                 if(StringUtils.isNotEmpty(sDate)){
24                      if(StringUtils.isNotEmpty(str)){
25                          str=str+" AND gmt_create:["+sDate+" TO "+eDate+"]";
26                      }else{
27                          str=str+" gmt_create:["+sDate+" TO "+eDate+"]";
28                      }
29                 }
30                 //设置搜索条件
31                 Query query=queryParser.parse(str);
32                 //查询搜索引擎
33                 TopDocs result = indexSearch.search(query, 10);
34                 //上一页的最后一个document索引
35                 int index=(page.getCurrentPage()-1)*page.getPerPageSize();
36                 ScoreDoc scoreDoc=null;
37                 //如果当前页是第一页面scoreDoc=null。
38                 if(index>0){
39                     //因为索引是从0开始所以要index-1
40                     scoreDoc=result.scoreDocs[index-1];
41                 }
42                 //分页处理
43                 TopDocs hits= indexSearch.searchAfter(scoreDoc, query, page.getPerPageSize());
44                 //设置分页的总记录数
45                 page.setCounts(hits.totalHits);
46                 BlogsDO blog=null;
47                 //循环hits.scoreDocs数据,并使用indexSearch.doc方法把Document还原,再拿出对应的字段的值
48                 for (int i = 0; i < hits.scoreDocs.length; i++) {
49                     ScoreDoc sdoc = hits.scoreDocs[i];
50                     Document doc = indexSearch.doc(sdoc.doc);
51                     blog=new BlogsDO();
52                     String title=doc.get("title");
53                     String mark=doc.get("content");
54                     //加亮处理
55                     SimpleHTMLFormatter simplehtml=new SimpleHTMLFormatter("<font color='red'>", "</font>");
56                     Highlighter highlighter = new Highlighter(simplehtml,new QueryScorer(query));
57                     if(title!=null){
58                             tokenStream = analyzer.tokenStream("title",new StringReader(title));
59                             String highLightText = highlighter.getBestFragment(tokenStream, title);
60                             blog.setTitle(highLightText==null?title:highLightText);
61                     }else{
62                         blog.setTitle(title);
63                     }
64                     //加亮处理
65                     if(mark!=null){
66                         tokenStream = analyzer.tokenStream("content",new StringReader(mark));
67                         String highLightText = highlighter.getBestFragment(tokenStream, mark);
68                         blog.setContent(highLightText==null?mark:highLightText);
69                     }else{
70                         blog.setContent(mark);
71                     }
72                     blog.setBlogsId(Integer.valueOf(doc.get("blogsId")));
73                     blog.setNickName(doc.get("nickName"));
74                     blog.setbTypeId(doc.get("bTypeId"));
75                     blog.setbTypeName(doc.get("bTypeName"));
76                     blog.setRevDate(doc.get("gmt_create"));
77                     SimpleDateFormat sdf =  new  SimpleDateFormat("yyyyMMddHHmmss");
78                     blog.setGmtCreate(sdf.parse(doc.get("gmt_create")));
79                     blogList.add(blog);
80                 }
81                 indexSearch.close();
82          }catch (java.text.ParseException e) {
83                 // TODO Auto-generated catch block
84                 e.printStackTrace();
85          }catch (InvalidTokenOffsetsException e) {
86                 // TODO Auto-generated catch block
87                 e.printStackTrace();
88          }
89          return blogList;





Lucene 3.5 在学习中,请多多指教!呵呵!

记住该记住的,忘记该忘记的,改变能改变的,接受不能改变的!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: