您的位置:首页 > 其它

nutch2.3抓取的网页使用solr建立索引

2015-10-31 00:00 483 查看
摘要: nutch2.3抓取的网页使用solr建立索引,solrindex 命令

1,安装solr

2,将NUTCH_HOME/runtime/local/conf/schema-solr4.xml复制到SOLR_HOME/excample/solr/collection1/conf/下,并改名为schema.xml,在文件中添加<field name="_version_" type="long" indexed="true" stored="true"/>

3,启动hbase

如果是hbase 0.94.*的版本需要修改host

官方是这么说的:

The following /etc/hosts file works correctly for HBase 0.94.x and earlier, on Ubuntu. Use this as a template if you run into trouble.
127.0.0.1 localhost
127.0.0.1 ubuntu.ubuntu-domain ubuntu


关键是下面这条命令,就会在solr中建立索引

bin/nutch solrindex http://127.0.0.1:8983/solr/ -reindex -crawlId 6vhao
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: