国内私募机构九鼎控股打造APP,来就送 20元现金领取地址:http://jdb.jiudingcapital.com/phone.html
内部邀请码:C8E245J (不写邀请码,没有现金送)
国内私募机构九鼎控股打造,九鼎投资是在全国股份转让系统挂牌的公众公司,股票代码为430719,为“中国PE第一股”,市值超1000亿元。 
------------------------------------------------------------------------------------------------------------------------------------------------------------------

原文地址:http://hj-learning.iteye.com/blog/1757275

花费了大半天时间在Window系统中搭建Heritrix 3.1的Eclipse开发环境。走了些弯路,但最终都搞定。将其中的经验跟大家分一下。

  • 相关软件准备

(1)安装JDK1.6, 做java开发的都会,不罗嗦了。 
(2)安装Maven2,版本2.2.1,具体步骤参考:待写教程 
(3)安装Git,具体步骤参考:待写教程 
(4)安装Eclipse,版本eclipse-jee-indigo-SR2-win32

  • 进入正题

(1)克隆Git源码库

  1. cd C:\Users\jHan\Developer\Heritrix3\source //需修改为自己本地实际的路径
  2. git clone git://github.com/internetarchive/heritrix3.git

或者使用TortoiseGit克隆源码仓库

(2)获取项目相关依赖包 
进入Command,

  1. cd C:\Users\jHan\Developer\Heritrix3\source\heritrix3  //heritrix3的源码目录
  2. mvn -Dmaven.test.skip=true install

(3)修改.classpath文件--需要注意的地方 
源码中自带的.classpath有些问题,缺少一些依赖的jar包。具体如下:

  1. 增加依赖包libidn-1.15.jar和archive-commons-1.0-SNAPSHOT.jar:
  2. <classpathentry kind="var" path="M2_REPO/org/gnu/inet/libidn/1.15/libidn-1.15.jar"/>
  3. <classpathentry kind="var" path="M2_REPO/org/archive/archive-commons/1.0-SNAPSHOT/archive-commons-1.0-SNAPSHOT.jar"/>
  4. 删除依赖的工程archive-commons:
  5. <classpathentry combineaccessrules="false" kind="src" path="/archive-commons"/>

(3)导入项目 
打开Eclipse,

  1. 选择File / Import... / Existing Projects Into Workspace,选择C:\Users\jHan\Developer\Heritrix3\source\heritrix3

(4)Eclipse中设置M2_REPO变量

  1. 选择 Project > Properties > Java Build path >
  2. 选择 Libraries 标签 > Add variable > Configure variables > New
  3. Name: M2_REPO
  4. Path: C:/Users/jHan/.m2/repository //路径修改为自己本地maven仓库的实际位置

(5)创建Debug/Run Configuration

    1. 打开 Run / Debug Configurations...
    2. 双击 Java Applications 创建一个新的
    3. 选择 Main class: org.archive.crawler.Heritrix
    4. 在Arguments标签中操作:
    5. 在Program arguments中输入: -a admin:admin -l dist/src/main/conf/logging.properties
    6. 在VM arguments中输入: -Dheritrix.development

Windows, Eclipse下开发Heritrix 3.1 (一)环境搭建的更多相关文章

  1. windows phone 8 开发系列(一)环境搭建

    一:前奏说明 本人一名普通的neter,对新玩意有点小兴趣,之前wp7出来的时候,折腾学习过点wp7开发,后来也没怎么用到(主要对微软抛弃wp7的行为比较不爽),现在wp8已经出来一段时间了,市场上也 ...

  2. Windows使用WxWidgets开发界面(c++)环境搭建

    一直想学习wxWidgets,之前使用的都是wxPython,现在终于鼓起勇气学习这个了,发现原来是基于vc6.0开发的.所以最好的学习办法就是安装vistual studio 2010,方便学习看代 ...

  3. 【转】如何在eclipse下配置Heritrix

    如何配置在eclipse下配置Heritrix 在其他帖子上看到有Eclipse 配置 Heritrix 1.14.4的文章,这里有很多内容是引用自那里.如http://extjs2.javaeye. ...

  4. 4-1eclipse & 4-2在eclipse下开发Java

    ecplise是一款继承的开发工具,可以开发我们的java程序. 下载地址: https://www.eclipse.org/downloads/ 视频中ecplise的版本 安装Ecplise: 默 ...

  5. Android开发使用控件入门--环境搭建

    Android开发使用控件入门--环境搭建 软件名称(,梦,,想.CAD  ,控件) 1. 环境搭建: 3 1.1. 安装Eclipse 3 1.2. 下载JDK 3 1.3. 下载Android S ...

  6. Windows Server 2003 IIS6.0+PHP5(FastCGI)+MySQL5环境搭建教程

    准备篇 一.环境说明: 操作系统:Windows Server 2003 SP2 32位 PHP版本:php 5.3.14(我用的php 5.3.10安装版) MySQL版本:MySQL5.5.25 ...

  7. Ubuntu下nginx+uwsgi+flask的执行环境搭建

    选择web framwork是个非常艰难的事情, 主要分为轻量级和重量级框架. 因为没有搭建站点这样的须要, 所以回避SSH, Django这样的框架, 而选择一个轻量级框架. 自己也比較青睐pyth ...

  8. Linux下Jenkins+git+gradle持续集成环境搭建

    Linux下Jenkins+git+gradle持续集成环境搭建 来源:IT165收集  发布日期:2014-08-22 21:45:50 我来说两句(0)收藏本文   一.项目介绍 和 linux ...

  9. arcgis api for flex 开发入门(一)环境搭建

    http://www.cnblogs.com/wenjl520/archive/2009/06/02/1494514.html arcgis api for flex 开发入门(一)环境搭建arcgi ...

随机推荐

  1. 1090-Rock, Paper, Scissors

    描述 Rock, Paper, Scissors is a classic hand game for two people. Each participant holds out either a ...

  2. HDU 2986 Ballot evaluation(精度问题)

    点我看题目 题意 : 给你n个人名,每个名后边跟着一个数,然后m个式子,判断是否正确. 思路 :算是一个模拟吧,但是要注意浮点数容易丢失精度,所以要好好处理精度,不知道多少人死在精度上,不过我实在是不 ...

  3. 如何忽略usb host 模式设备连接确认对话框

    <li class="alt"><span><span>package android.hardware.usb;  </span> ...

  4. iOS,Android网络抓包教程之tcpdump

    现在的移动端应用几乎都会通过网络请求来和服务器交互,通过抓包来诊断和网络相关的bug是程序员的重要技能之一.抓包的手段有很多:针对http和https可以使用Charles设置代理来做,对于更广泛的协 ...

  5. Linux内存初始化

    start_kernel -> setup_arch 在这个函数中我们主要看这几个函数. machine_specific_memory_setup max_low_pfn = setup_me ...

  6. 【HDOJ】1171 Big Event in HDU

    母函数,先要算搞清楚组合数可能的最大值.非常大.N种设备的最大VAL*最大数量. #include <stdio.h> #include <string.h> #define ...

  7. 坑爹的libxml2 for mingw 编译 (二)

    makefile 中由于大量使用了cmd /C ""样式去执行mkdir和copy操作,导致mingw最后出错,因为会从mingw切换至cmd界面.因此需要把相关代码进行修改. # ...

  8. MapReduce——计算温度最大值 (基于全新2.2.0API)

    MapReduce——计算温度最大值 (基于全新2.2.0API) deprecated: Job类的所有Constructors, 新的API用静态方法getInstance(conf)来去的Job ...

  9. hadoop2.2编程:自定义hadoop map/reduce输入文件切割InputFormat

    hadoop会对原始输入文件进行文件切割,然后把每个split传入mapper程序中进行处理,FileInputFormat是所有以文件作为数据源的InputFormat实现的基类,FileInput ...

  10. bzoj2738

    感人肺腑pascal过不去系列,跪求开O2先不说这个了,学完cdq分治之后又顺手学了一下整体二分感觉这两个东西很多相似的地方,干脆都叫cdq分治好了二分解决k小就是设当前二分的答案为m,把x<= ...