打造自己的搜索引擎
2015-11-26 10:52
573 查看
这周项目要做一个搜索引擎系统,于是,我看看了看上下左右,看来只有我来弄了~~
代码其中参考了@红薯的Lucene 早年分享的代码,与一些朋友的精华博客。算是入门了,这个入门花了我40篇日志。
Lucene 做的是搜索,存储功能,用的是,Lucene5。
IKAnalyzer做的是分词功能,用的是,IKAnalyzer5。
因为涉及到公司,产品,文章,所以建立了多个索引,需要在多个索引之间进行查询,如果索引发生变更,则需要立马查询到最新数据。
2.分页与文章段落标红显示。
Lucene的分页功能,一定要优化~
关键字标红功能,特别是文章某一段匹配了关键字,然后只显示那一段前后的文字,效果图里有效果,详情里前后有"..."的就是,不是整个内容全部显示,而是某一部分前后标红显示。
3.查询公司名称时只输入公司名一个字搜索不到公司。
这时就需要扩展词典,将useSmart关闭。
代码其中参考了@红薯的Lucene 早年分享的代码,与一些朋友的精华博客。算是入门了,这个入门花了我40篇日志。
需求
项目中会用到搜索,需求不复杂:根据关键字,搜索出文章,公司,产品。技术
Java(Spring)用于查询数据源,用的是,JDK7。Lucene 做的是搜索,存储功能,用的是,Lucene5。
IKAnalyzer做的是分词功能,用的是,IKAnalyzer5。
关键点
1.Lucene的多个索引目录的近实时搜索。因为涉及到公司,产品,文章,所以建立了多个索引,需要在多个索引之间进行查询,如果索引发生变更,则需要立马查询到最新数据。
2.分页与文章段落标红显示。
Lucene的分页功能,一定要优化~
关键字标红功能,特别是文章某一段匹配了关键字,然后只显示那一段前后的文字,效果图里有效果,详情里前后有"..."的就是,不是整个内容全部显示,而是某一部分前后标红显示。
3.查询公司名称时只输入公司名一个字搜索不到公司。
这时就需要扩展词典,将useSmart关闭。
效果图
未完待续~~~
相关文章推荐
- java对世界各个时区(TimeZone)的通用转换处理方法(转载)
- java-注解annotation
- java-模拟tomcat服务器
- java-用HttpURLConnection发送Http请求.
- java-WEB中的监听器Lisener
- Android IPC进程间通讯机制
- Android Native 绘图方法
- Android java 与 javascript互访(相互调用)的方法例子
- 介绍一款信息管理系统的开源框架---jeecg
- 聚类算法之kmeans算法java版本
- java实现 PageRank算法
- PropertyChangeListener简单理解
- 插入排序
- 冒泡排序
- 堆排序
- 快速排序
- 二叉查找树
- [原创]java局域网聊天系统