Heritrix在开发环境myEclipse下的配置方法
2010-10-15 20:01
369 查看
配置的时候,先从网上搜的配置方法,但不知道怎么回事,老是配置不成功,就是输入http://127.0.0.1:8090(我设置的端口是8090)时,打不开。我看网上配置的方法都是大同小异的,但不知道怎么到我这就不成功了,很苦恼。后来不知怎么的,就认认真真的按部就班的按一篇文章上写的配置,配置成功了。
下面是我配置成功参考的步骤:
主要步骤如下:
1. 下载heritrix-1.14.4.zip和heritrix-1.14.4-src.zip,分别解压到heritrix-1.14.4和heritrix-1.14.4-src;
2.新建空的Java Project, 命名为Heritrix(路径为%MYECLIPSE_HOME%/workspace/Heritrix); (注:Eclipse在创建工程有两种选择,可不用把代码放进src目录,默认的话,会生成bin和src文件夹的,在下图选择,第一个就是不用放在src,第二个是默认的。我选择的是不把代码放到src中
3. 把heritrix-1.14.4-src/src/java/目录下的org文件夹和st文件夹拷贝到Heritrix根目录下;
把heritrix-1.14.4/src下的webapps文件夹拷贝到Heritrix根目录下;
把heritrix-1.14.4-src下的lib目录拷贝到Heritrix根目录下;
4. 解压缩heritrix-1.14.4目录下的heritrix-1.14.4.jar文件到heritrix_jar文件夹,把heritrix_jar目录下的modules、profiles、selftest三个文件夹以及arcMetaheaderBody.xsl、heritrix.properties、jndi.properties拷贝到Heritrix根目录下;
5. 在项目Herirtix的Propertries->Java Build Path->Liabraries->Add External JARs 引入F:/Heritrix/heritrix-1.14.4-src/lib的jar包
6. 打开Heritrix /heritrix.properties文件,找到“heritrix.cmdline.admin =”,修改为“heritrix.cmdline.admin = admin:admin”;“heritrix.cmdline.port = 8090”
7. 找到org.archive.crawler包,运行Heritrix.java中的main函数,run as Java Application。得到下面的提示信息:
11:55:13.750 EVENT Starting Jetty/4.2.23
11:55:14.218 EVENT Started WebApplicationContext[/,Heritrix Console]
11:55:14.437 EVENT Started SocketListener on 127.0.0.1:8090
11:55:14.437 EVENT Started org.mortbay.jetty.Server@a01335
Heritrix version: 1.14.3
可能出现的问题:
配置好之后当我们运行Heritrix.java的时候可能编译不通过。这是因为sun包是受保护的包,默认只有sun公司的软件才能使用。myEclipse会报错,把对保护使用waring就可以了。修改方式(myEclipse菜单栏):
Windows -> Preferences -> Java -> Compiler -> Errors/Warnings-> Deprecated and trstricted API -> Forbidden reference (access rules): -> change to warning
8、在org.archive.crawler包中找到Heritrix.java文件并运行。可以在浏览器中键入http://127.0.0.1:8090察看结果。
下面是我配置成功参考的步骤:
主要步骤如下:
1. 下载heritrix-1.14.4.zip和heritrix-1.14.4-src.zip,分别解压到heritrix-1.14.4和heritrix-1.14.4-src;
2.新建空的Java Project, 命名为Heritrix(路径为%MYECLIPSE_HOME%/workspace/Heritrix); (注:Eclipse在创建工程有两种选择,可不用把代码放进src目录,默认的话,会生成bin和src文件夹的,在下图选择,第一个就是不用放在src,第二个是默认的。我选择的是不把代码放到src中
3. 把heritrix-1.14.4-src/src/java/目录下的org文件夹和st文件夹拷贝到Heritrix根目录下;
把heritrix-1.14.4/src下的webapps文件夹拷贝到Heritrix根目录下;
把heritrix-1.14.4-src下的lib目录拷贝到Heritrix根目录下;
4. 解压缩heritrix-1.14.4目录下的heritrix-1.14.4.jar文件到heritrix_jar文件夹,把heritrix_jar目录下的modules、profiles、selftest三个文件夹以及arcMetaheaderBody.xsl、heritrix.properties、jndi.properties拷贝到Heritrix根目录下;
5. 在项目Herirtix的Propertries->Java Build Path->Liabraries->Add External JARs 引入F:/Heritrix/heritrix-1.14.4-src/lib的jar包
6. 打开Heritrix /heritrix.properties文件,找到“heritrix.cmdline.admin =”,修改为“heritrix.cmdline.admin = admin:admin”;“heritrix.cmdline.port = 8090”
7. 找到org.archive.crawler包,运行Heritrix.java中的main函数,run as Java Application。得到下面的提示信息:
11:55:13.750 EVENT Starting Jetty/4.2.23
11:55:14.218 EVENT Started WebApplicationContext[/,Heritrix Console]
11:55:14.437 EVENT Started SocketListener on 127.0.0.1:8090
11:55:14.437 EVENT Started org.mortbay.jetty.Server@a01335
Heritrix version: 1.14.3
可能出现的问题:
配置好之后当我们运行Heritrix.java的时候可能编译不通过。这是因为sun包是受保护的包,默认只有sun公司的软件才能使用。myEclipse会报错,把对保护使用waring就可以了。修改方式(myEclipse菜单栏):
Windows -> Preferences -> Java -> Compiler -> Errors/Warnings-> Deprecated and trstricted API -> Forbidden reference (access rules): -> change to warning
8、在org.archive.crawler包中找到Heritrix.java文件并运行。可以在浏览器中键入http://127.0.0.1:8090察看结果。
相关文章推荐
- MyEclipse8.5 开发环境配置中SVN插件安装方法
- MyEclipse8.5 开发环境配置中SVN插件安装方法
- jdk,tomcat,myeclipse开发环境变量的配置
- MyEclipse 8.5 开发环境配置,汉化,SVN 插件,Flex Builder 3/4 插件安装
- Eclipse+MYEclipse+JBoss 配置J2EE开发环境
- 【利用Eclipse+Tomcat+MyEclipse环境开发J2EE之一】环境的配置
- J2EE运行和开发环境的安装与配置(JDK+TOMCAT 6.5+MyEclipse)(2)
- [转]Ubuntu下Nginx/PHP/MYSQL开发环境的配置方法 .
- 配置基于MyEclipse 8的Android 2.1开发环境(详细)以及Hello World
- 配置ArcGIS Server Java开发环境(myEclipse)
- Hadoop myeclipse和eclipse开发环境的配置
- Java开发环境配置方法
- Linux环境下Eclipse + Tomcat + MySQL 配置J2EE开发环境的方法
- MyEclipse/eclipse的php开发调试环境配置
- 配置MyEclipse开发环境,并创建项目(史上最全)
- 在MyEclipse 6.5中配置ext开发环境
- Win7 32位系统下Sublime text 3的安装以及配置C/C++、java、python的开发环境方法
- MyEclipse Android SDK2.3开发环境搭建、配置
- 配置springmvc/myeclipse开发环境及服务器安全
- Ubuntu配置wxWidgets跨平台C++开发环境的方法