今天看到一个新的知识Lucene
2008-03-08 00:38
302 查看
Lucene 简介
Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。
目前已经有很多应用程序的搜索功能是基于 Lucene 的,比如 Eclipse 的帮助系统的搜索功能。Lucene 能够为文本类型的数据建立索引,所以你只要能把你要索引的数据格式转化的文本的,Lucene 就能对你的文档进行索引和搜索。比如你要对一些 HTML 文档,PDF 文档进行索引的话你就首先需要把 HTML 文档和 PDF 文档转化成文本格式的,然后将转化后的内容交给 Lucene 进行索引,然后把创建好的索引文件保存到磁盘或者内存中,最后根据用户输入的查询条件在索引文件上进行查询。不指定要索引的文档的格式也使 Lucene 能够几乎适用于所有的搜索应用程序。
我现在只知道他是用来做索引、搜索等功能的。做java开发的可以了解一下。如果了解更多,请Google/Baidu.
Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。
目前已经有很多应用程序的搜索功能是基于 Lucene 的,比如 Eclipse 的帮助系统的搜索功能。Lucene 能够为文本类型的数据建立索引,所以你只要能把你要索引的数据格式转化的文本的,Lucene 就能对你的文档进行索引和搜索。比如你要对一些 HTML 文档,PDF 文档进行索引的话你就首先需要把 HTML 文档和 PDF 文档转化成文本格式的,然后将转化后的内容交给 Lucene 进行索引,然后把创建好的索引文件保存到磁盘或者内存中,最后根据用户输入的查询条件在索引文件上进行查询。不指定要索引的文档的格式也使 Lucene 能够几乎适用于所有的搜索应用程序。
我现在只知道他是用来做索引、搜索等功能的。做java开发的可以了解一下。如果了解更多,请Google/Baidu.
相关文章推荐
- 今天看到一个比较有意思的检查交换机端口好坏的方法
- 今天在csdn看到一博主今年大三,初中就喜欢上编程,学习了各种知识,初中…挺震惊。不禁细数我的编程史,挺有感。
- 今天看到的一个讨论
- 今天看到一个关于黄帝内经的消息,祝华英的消息
- 今天看到的一个犀利的带符号字符串一起反转的代码
- 今天在InfoQ看到一个google关于test的演讲, 非常精彩
- 今天在使用iscroll4 做一个简单触屏滚动demo,发现上下拖动的时候总是会回弹,不能看到下面的内容.这个问题苦恼了很久,终于解决
- 今天从www.embeded.cn看到MP3嵌入式的开发相关知识
- 今天是13年1月29日,一大早看到了CSDN的一个朋友的电子书下载,特此记录一下
- 今天在群里面看到一个画面,关于EDW监控的 蛮好看的 不知道是怎么做的
- 今天给加上一个计数器,看到自己的Blog都生锈了啊!以后要好好维护!
- 今天看到一个签名,有点意思
- 今天看到的一个有趣面试题:return *this和return this有什么区别?
- 我今天看到一个好东西,叫做coroutine,协程
- 从今天开始,看到一个记录一个,这些可都是犯罪证据啊,扔了可惜
- 今天看到一个台湾网站在做我原来计划的一个网站
- 今天看到一个网站,界面很漂亮 ,记下
- 今天上qq空间看到一个有意思的东西,类似射线的效果
- 今天看到一个段子······
- 今天看到一个很个性的blog