nutch2.3抓取的网页使用solr建立索引
2015-10-31 00:00
483 查看
摘要: nutch2.3抓取的网页使用solr建立索引,solrindex 命令
1,安装solr
2,将NUTCH_HOME/runtime/local/conf/schema-solr4.xml复制到SOLR_HOME/excample/solr/collection1/conf/下,并改名为schema.xml,在文件中添加<field name="_version_" type="long" indexed="true" stored="true"/>
3,启动hbase
如果是hbase 0.94.*的版本需要修改host
官方是这么说的:
The following /etc/hosts file works correctly for HBase 0.94.x and earlier, on Ubuntu. Use this as a template if you run into trouble.
关键是下面这条命令,就会在solr中建立索引
bin/nutch solrindex http://127.0.0.1:8983/solr/ -reindex -crawlId 6vhao
1,安装solr
2,将NUTCH_HOME/runtime/local/conf/schema-solr4.xml复制到SOLR_HOME/excample/solr/collection1/conf/下,并改名为schema.xml,在文件中添加<field name="_version_" type="long" indexed="true" stored="true"/>
3,启动hbase
如果是hbase 0.94.*的版本需要修改host
官方是这么说的:
The following /etc/hosts file works correctly for HBase 0.94.x and earlier, on Ubuntu. Use this as a template if you run into trouble.
127.0.0.1 localhost 127.0.0.1 ubuntu.ubuntu-domain ubuntu
关键是下面这条命令,就会在solr中建立索引
bin/nutch solrindex http://127.0.0.1:8983/solr/ -reindex -crawlId 6vhao
相关文章推荐
- 润达软件:未来OA将会如何演化
- 跨站设置cookie
- localStorage
- 5大最流行手机webAPP框架之Ionic
- UIScrollView语法用法样例
- Mantis邮件配置(v1.2.19版本。验证可用)
- MyBatis接口(Bean)与配置信息(Mapper)绑定
- Java中的消息队列
- jquery实现动画效果
- 使用freamset和fream做分页网站的好处(thinlphp)
- Ubuntu 14.04.3 LTS Desktop x64安装WPS
- IOS(swift)-数据存储 · NSKeyedArchiver 归档
- android studio入门
- expect使用详解
- 网页布局基础——文档流、盒子模型、浮动、定位
- CSS圆角进化论
- 一.学习Netty之ChannelHandler接口
- 二. 学习Netty之ChannelHandlerContext
- 三.netty学习之ChannelPipeline
- Windows 7键盘失灵导致无法输入登录密码问题解决方案