eclipse启动Heritrix
首先下载heritrix-1.14.4-src源码。可以在http://sourceforge.net/projects/archive-crawler/files/archive-crawler (heritrix 1.x)/1.14.4/,下载解压后。
在eclipse新建java project,命名为MyHeritrix,右键MyHeritrix-->properties-->java bulid path-->libraries查看jre system library是否是jdk的,不是的话将其remove掉,然后点击右边的add library-->jre system library选择系统安装的jdk,因为jdk包含了jre。创建lib文件夹,将源码里lib下的jar包复制到工程的lib下,选择所要的jar文件,右键-->bulid path,将jar文件添加进工程。
复制源码里src/java下的com、org、st文件夹到MyHeritrix工程的src下,复制源码里src下的conf文件夹到MyHeritrix的根目录下,复制源码里src下的webapps文件夹到MyHeritrix的根目录下,复制conf下的jmxremote.password.template文件到MyHeritrix的根目录下,并改名为jmxremote.password。修改该文件最后两行的内容,
monitorRole admin
controlRole admin
复制源码src\resources\org\archive\util下的tlds-alpha-by-domain.txt到MyHeritrix工程的org.archive.util下,修改MyHeritrix工程conf下的heritrix.properties。heritrix.cmdline.admin = admin:admin 用户名和密码是用冒号隔开 heritrix.cmdline.port默认是8080,可以改为别的端口号。
右键MyHeritrix工程-->run as-->Run Configurations,双击Java Application创建新的java应用,Main现在的Project选择MyHeritrix,Main class选择org.archive.crawler.Heritrix,点击上面的Classpath-->User Entries-->Advanced-->Add Folders 选择MyHeritrix工程下的conf文件夹,点击ok,点击apply,再点击run。最后控制台打印类似下面的信息,说明启动成功了。
06:37:32.957 EVENT Starting Jetty/4.2.23
06:37:33.040 EVENT Started WebApplicationContext[/,Heritrix Console]
06:37:33.072 EVENT Started SocketListener on 127.0.0.1:8080
06:37:33.072 EVENT Started org.mortbay.jetty.Server@1b65d9bd
Heritrix version: 1.14.4
然后在浏览器输入:http://localhost:8080 进入登录界面,用户名:admin 密码:admin 可以进入管理页面了。
eclipse启动Heritrix的更多相关文章
- eclipse启动tomcat无法访问
eclipse启动tomcat无法访问 症状: tomcat在eclipse里面能正常启动,而在浏览器中访问http://localhost:8080/不能访问,且报404错误.同时其他项目页面也不能 ...
- eclipse启动优化,终于不那么卡了!
eclipse启动优化,终于不那么卡了! 网上找了好多都是myEclipse的优化的,跟eclipse有点区别,找了很多方法还是不能让这个eclipse(Version: Kepler Release ...
- eclipse启动不了,出现“Java was started but returned exit code=13......”对话框
eclipse启动不了,出现"Java was started but returned exit code=13......"对话框如下 解决方案:1.使用的是java jdk6 ...
- Eclipse启动时发生An internal error occurred during: "Initializing Java Tooling".错误的解决方法
问题描述: Eclipse启动时发生An internal error occurred during: "Initializing JavaTooling".错误的解决方法 解决 ...
- 指定eclipse启动使用的JVM
不同eclispe对运行时要求不一样,而一台电脑只能同时使用一个运行时,当多个要求不同版本jvm的eclipse需要在一台电脑工作时,需要手动指定eclipse启动使用的jvm. [eclipse-j ...
- eclipse启动时报告错误:Java was started but returned exit code=-805306369
这两天也没改过eclipse和java的配置,但eclipse启动时报告错误:Java was started but returned exit code=-805306369 后来在eclipse ...
- Eclipse启动参数
from 网络 eclipse 启动参数 -clean2013-- : eclipse 启动参数介绍(如添加插件时,如果不显示,则使用eclipse -clean启动) 其实,Eclipse是一个可以 ...
- eclipse启动时报错 Could not create the java virtual machine
eclipse启动的时候 报错 这是系统为eclipse分配的内存不足,需要去修改 eclipse.ini文件 eclipse.ini是eclipse 内存分配之类的配置文件 对java虚拟机的 ...
- eclipse启动的时候报错 出现Java was started but returned exit code=13
eclipse启动的时候出现 这是你的jdk环境与你eclipse版本不匹配, 如果你的eclipse是32位的 jdk也得是32位的 重新安装一个比配的jdk就好了 如果你的jdk是解压版的 ...
随机推荐
- 49、word2vec - tensorflow
Python 3.5.2 (v3.5.2:4def2a2901a5, Jun 25 2016, 22:18:55) [MSC v.1900 64 bit (AMD64)] on win32Type & ...
- Fiddler的安装设置
一.安装设置Fiddler2 下载完成后安装,安装完成后打开 如下图设置Fiddler 代理: 二.设置手机代理 快捷键win+r打开运行窗口à输入:cmdà确定 在界面上输入:ipconfig,查 ...
- 《css揭秘》
<css揭秘> 第一章:引言 引言 案例们 第二章:背景与边框 背景和边框 半透明边框(rgba/hsla.background-clip) 多重边框(box-shadow) 灵活的背景定 ...
- scrapy 抓取动态网页
-- coding: utf-8 -- ''' gouwu.sogou.com Spider, Created on Dec, 2014 version: 1.0 author: chenqx @ht ...
- scale-free network
原文链接:http://lihailian.bokee.com/6013647.html 1.什么是无尺度现象? 统计物理学家习惯于把服从幂次分布的现象称为无尺度现象. 在做大量统计实验之前,科学家预 ...
- Java 序列化 JDK序列化总结
Java 序列化 JDK序列化总结 @author ixenos Java序列化是在JDK 1.1中引入的,是Java内核的重要特性之一.Java序列化API允许我们将一个对象转换为流,并通过网络发送 ...
- ORACLE ORDER BY用法总结
order by后面的形式却比较新颖(对于我来说哦),以前从来没看过这种用法,就想记下来,正好总结一下ORDER BY的知识. 1.ORDER BY 中关于NULL的处理 缺省处理,Oracle在Or ...
- curl 命令使用总结
curl 查看网页源码 curl www.sina.com 保存页面 -o curl -o [文件名] www.sina.com 直接在curl命令后加上网址,就可以看到网页源码. 如果要把这个网页保 ...
- Eclipse Bug: Unhandled event loop exception No more handles
我的解决方法如下: I had the same problem, turned out that TeamViewer was causing this. In your TeamViewer go ...
- Golang的"泛型"模式
只要实现了Sortable接口的所有方法,就可以使用该接口的函数. 我们通过冒泡排序来演示一下: package main import "fmt" type Sortable i ...