[转载] Apache Lucene初探
2015-08-14 11:48
411 查看
转载自http://www.cnblogs.com/xing901022/p/3933675.html
其次,关于第一次编程初探,建议还是查看官方资料。百度到的资料,目前Lucene已经更新到4.9版本,这个版本需要1.7以上的JDK,所以如果还用1.6甚至是1.5的小盆友,请参考低版本,由于我用的1.6,因此在使用Lucene4.0。
这是Lucene4.0的官网文档:http://lucene.apache.org/core/4_0_0/core/overview-summary.html
这里非常佩服Lucene的开元贡献者,可以阅读Lucene in Action,作者最初想要写软件赚钱,最后贡献给了Apache,跑题了。
最后,提醒学习Lucene的小盆友们,这个开源软件的版本更新不慢,版本之间的编程风格亦是不同,所以如果百度到的帖子,可能这段代码,用了4.0或者3.6就会不好使。
比如,以前版本的申请IndexWriter时,是这样的:
但是4.0,我们需要配置一个conf,把配置内容放到这个对象中:
所以,请一定要参考官方文档的编程风格,进行代码的书写。
最后的最后,从官网上面下载下来的文件,已经上传至百度网盘,欢迎下载。
View Code
回到顶部
回到顶部
Lucene官方文档:http://lucene.apache.org/core/4_0_0/core/overview-summary.html
讲解之前,先来分享一些资料
首先呢,学习任何一门新的亦或是旧的开源技术,百度其中一二是最简单的办法,先了解其中的大概,思想等等。这里就贡献一个讲解很到位的ppt。已经被我转成了PDF,便于搜藏。其次,关于第一次编程初探,建议还是查看官方资料。百度到的资料,目前Lucene已经更新到4.9版本,这个版本需要1.7以上的JDK,所以如果还用1.6甚至是1.5的小盆友,请参考低版本,由于我用的1.6,因此在使用Lucene4.0。
这是Lucene4.0的官网文档:http://lucene.apache.org/core/4_0_0/core/overview-summary.html
这里非常佩服Lucene的开元贡献者,可以阅读Lucene in Action,作者最初想要写软件赚钱,最后贡献给了Apache,跑题了。
最后,提醒学习Lucene的小盆友们,这个开源软件的版本更新不慢,版本之间的编程风格亦是不同,所以如果百度到的帖子,可能这段代码,用了4.0或者3.6就会不好使。
比如,以前版本的申请IndexWriter时,是这样的:
IndexWriter indexWriter = new IndexWriter(indexDir,luceneAnalyzer, true );
但是4.0,我们需要配置一个conf,把配置内容放到这个对象中:
IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_CURRENT, analyzer); IndexWriter iwriter = new IndexWriter(directory, config);
所以,请一定要参考官方文档的编程风格,进行代码的书写。
最后的最后,从官网上面下载下来的文件,已经上传至百度网盘,欢迎下载。
View Code
回到顶部
运行结果:
所有包含man关键字的文件,都被筛选出来了。回到顶部
参考资料
JAVA读取文本大全:http://blog.csdn.net/csh624366188/article/details/6785817Lucene官方文档:http://lucene.apache.org/core/4_0_0/core/overview-summary.html
相关文章推荐
- Apache端口复用-模块rootme
- Apache的压力测试工具ab
- Python开发入门与实战16-APACHE部署
- 如何编译Apache Hadoop2.6.0源代码
- apache activemq 学习笔记
- org.apache.commons.lang3功能示例
- 优化Apache,提高并发
- Apache2 Axis2/C 搭建 hello world
- Apache配置文件详解
- Amazon Linux 编译安装 Apache 2.4 + PHP 5.5
- org.apache.hadoop.hdfs.server.datanode.DataNode: Exception in BPOfferService for Block pool
- 服务器配置apache2.4+php5.6+mysql
- Spark Shuffle过程的一些小结(译 Shuffle Performance in Apache Spark)
- Linux+Apache+DB2+PHP环境配置
- django apache 发布
- No plugin found for prefix 'jetty' in the current project and in the plugin groups [org.apache.mave
- Could not calculate build plan: Plugin org.apache.maven.plugins:maven-resources-plugin:2.5 or one of
- linux下安装apache服务器
- ubnutu 环境下 在APACHE服务器上的访问方式上去除index.php
- 使用Apache Solr对数据库建立索引(包括处理CLOB、CLOB)