Nutch学习之Win7环境下在eclipse中搭建Nutch+solr+tomcat
2014-07-26 11:37
543 查看
Nutch学习之Win7环境下在eclipse中搭建Nutch+solr+tomcat(一)
最近,因为工作的需要,要获取一些旅游景点的信息(主要是某省的旅游景点,大大小小大概有几千个)。在网上查阅了相关资料后,果断选择了Nutch(至于为什么,我也说不出来,可能就是眼缘吧 ^_^)。完成工作后,有点时间就把自己的工作记录下来,以便以后查阅!当然第一步就是环境的搭建了。我所用的是Win7环境,故搭建起来比较繁琐。就我了解Linux下会很方便。这一节将介绍在win7环境下eclipse中搭建Nutch的方法,为以后进行Nutch二次开发做好准备工作。
一、软件及环境
1. 操作系统: Win7操作系统2. nutch版本:apache-nutch-1.4-bin.zip
3. solr版本:apache-solr-3.5.0.zip
4. Tomcat版本:apache-tomcat-7.0.54-windows-x86.zip
5. eclipse版本:elipse-jee-indigo-SR1-win32.zip
6. jdk版本:jdk1.7.0_07
7. cygwin:
8. Ant版本:apache-ant-1.8.3-bin.zip
1.1 JDK安装
jdk安装方法很简单,这里不再赘述,记得最后要进行环境变量的配置!1.2 cygwin安装配置
cygwin安装有两种方式,一种是直接下载安装包,还有一种是在线安装,我选择的是后一种。由于Nutch是在hadop基础上的,而hadoop是在Linux环境下运行的,故在Windows下安装Nutch,必须安装cygwin来模拟Linux。安装过程不是很复杂,注意几点就可以了:因为我是在线安装,故应选择Install from Internet ;进入“select packages”对话框时,要选择相应的包,默认时是没有添加的,必须保证“Net Category”下的“OpenSSL”被安装,如下图所示:
如果还打算在eclipse 上编译Hadoop,则还必须安装“Base Category”下的“sed”,如
下图所示:
另外,还建议将“Editors Category”下的vim安装,以方便在Cygwin 上直接修改配置文件,如下图所示:
下面就简单了,直接“下一步”,然后选择一个镜像安装。
接下来就是cygwin的环境变量配置。其实,就是将F:\Cygwin\bin添加到Path环境变量中,即可。
验证是否安装成功,可以使用命令:cygcheck -c cygwin,如果出现以下画面,就说明安装成功!
1.3 Ant安装
将apache-ant-1.8.3-bin.zip解压到F:\NutchWorkPlat并重命名为ant,接下来配置环境变量即可。将F:\NutchWorkPlat\ant\bin和F:\NutchWorkPlat\ant\lib添加到Path环境变量中。1.4 eclipse 及插件安装
在官网下载一个eclipse,无需安装,只需把它解压即可,我这里解压到 F:\NutchWorkPlat\eclipse 打开即可。下面在eclipse中安装相关的插件
IvyDE安装配置:所需的jar包目录如下
把“org.apache.ivyde.eclipse_2.2.0.final-201311091524-RELEASE.jar”复制到Eclipse安装目录的“plugins”中。
把“org.apache.ivyde.feature_2.2.0.final-201311091524-RELEASE.jar”解压到Eclipse安装目录的“features”中。
把“org.apache.ivy.eclipse.ant_2.3.0.final_20130110142753.jar”和“org.apache.ivy_2.3.0.final_20130110142753.jar”复制到Eclipse安装目录的“plugins”中
把“org.apache.ivy.feature_2.3.0.final_20130110142753.jar”解压到Eclipse安装目录的“features”中。
完成以上步骤之后,重启Eclipse,打开Window -> preference对话框里看到ivy一栏;打开Help -> About Eclipse -> Installation-> Plug-ins列表里也可以看到两个ivy,一个ivyDe。
1.5 Tomcat安装配置
将apache-tomcat-7.0.54-windows-x86.zip解压到F:\NutchWorkPlat ,并重命名为tomcat。进入“E:\NutchWorkPlat\tomcat\bin”点击“startup.bat”,tomcat会启动。然后在浏览器中输入http://localhost:8080,会出现以下画面:接着安装Tomcat的Eclipse插件,并让Eclipse与Tomcat结合,把“tomcatPluginV33.zip”后的“com.sysdeo.eclipse.tomcat_3.3.0”复制到“E:\NutchWorkPlat\eclipse\plugins”中,然后重启Eclipse。
打开Windowpreference对话框里看到tomcat一览,点击tomcat,把刚才解压的tomcat进行关联,操作如下。
此时eclipse界面中会出现,点击Start Tomcat,在控制台会出现tomcat启动的相关信息,再在浏览器输入http://localhost:8080,查看tomcat启动情况。
这个我在配置的时候,最后发现在eclipse的界面中没有出现三个小猫按钮,查其原因:因为我的eclipse是下载了一个直接解压后就能用的包。所以只需把elipse安装目录下的configuration里面的东西都删掉,再重新从压缩包里解压出相应的目录即可。分析原因可能是因为程序在启动时,没有把新解压进去的tomcat插件configure,所以导致始终不能出现tomcat图标。
下一篇将介绍,将nutch和solr部署到eclipse中......
相关文章推荐
- Solr学习第一期:Win7下搭建Tomcat运行环境
- solr学习之(九)_用solr的源码搭建eclipse+tomcat开发环境
- [Nutch]Nutch+Eclipse+Tomcat+Solr+Cygwin搭建Windows开发环境
- Win7下单机版的伪分布式solrCloud环境搭建Tomcat7+ solr-5.2.1+zookeeper3.4.6
- Win7下单机版的伪分布式solrCloud环境搭建Tomcat+solr+zookeeper【转】
- CentOS6.5下nutch1.7+solr4.8.1+Eclipse环境搭建(二)之solr4.8.1安装
- solr6.6.0学习(1) SOLR+TOMCAT进行环境搭建
- CentOS6.5下nutch1.7+solr4.8.1+Eclipse环境搭建(一)之nutch1.7安装
- JDK+Eclipse+Mysql+Tomcat搭建Java学习开发环境
- Java学习二(搭建eclipse + tomcat + maven 开发环境)
- Java 学习笔记 开发环境搭建JDK+Tomcat+Eclipse
- Eclipse+Tomcat+springMVC环境搭建与jsp页面学习笔记
- Java 学习笔记 开发环境搭建JDK+Tomcat+Eclipse
- 通过eclipse管理tomcat并建立web工程(jsp开发的环境搭建)(eclipse的基本设置)——win7 32位
- Solr学习笔记一 ---Solr运行环境搭建(tomcat7 + solr 3.5 +ubuntu 10.04)
- Java 学习笔记 开发环境搭建JDK+Tomcat+Eclipse
- windows配置JDK+eclipse+tomcat J2EE开发环境的搭建
- [原创]Eclipse3.0.1+Lomboz3.0.1+EMF2.0.1+Tomcat 5.0.30 JSP开发环境搭建实战记录
- 用Eclipse、Tomcat、Lomboz搭建jsp开发环境
- (转)Tomcat+MySQL+JSP+LCDS+Flex+Eclipse环境搭建完美攻略