国内私募机构九鼎控股打造APP,来就送 20元现金领取地址:http://jdb.jiudingcapital.com/phone.html
内部邀请码:C8E245J (不写邀请码,没有现金送)
国内私募机构九鼎控股打造,九鼎投资是在全国股份转让系统挂牌的公众公司,股票代码为430719,为“中国PE第一股”,市值超1000亿元。 
------------------------------------------------------------------------------------------------------------------------------------------------------------------

原文地址:http://hj-learning.iteye.com/blog/1757275

花费了大半天时间在Window系统中搭建Heritrix 3.1的Eclipse开发环境。走了些弯路,但最终都搞定。将其中的经验跟大家分一下。

  • 相关软件准备

(1)安装JDK1.6, 做java开发的都会,不罗嗦了。 
(2)安装Maven2,版本2.2.1,具体步骤参考:待写教程 
(3)安装Git,具体步骤参考:待写教程 
(4)安装Eclipse,版本eclipse-jee-indigo-SR2-win32

  • 进入正题

(1)克隆Git源码库

  1. cd C:\Users\jHan\Developer\Heritrix3\source //需修改为自己本地实际的路径
  2. git clone git://github.com/internetarchive/heritrix3.git

或者使用TortoiseGit克隆源码仓库

(2)获取项目相关依赖包 
进入Command,

  1. cd C:\Users\jHan\Developer\Heritrix3\source\heritrix3  //heritrix3的源码目录
  2. mvn -Dmaven.test.skip=true install

(3)修改.classpath文件--需要注意的地方 
源码中自带的.classpath有些问题,缺少一些依赖的jar包。具体如下:

  1. 增加依赖包libidn-1.15.jar和archive-commons-1.0-SNAPSHOT.jar:
  2. <classpathentry kind="var" path="M2_REPO/org/gnu/inet/libidn/1.15/libidn-1.15.jar"/>
  3. <classpathentry kind="var" path="M2_REPO/org/archive/archive-commons/1.0-SNAPSHOT/archive-commons-1.0-SNAPSHOT.jar"/>
  4. 删除依赖的工程archive-commons:
  5. <classpathentry combineaccessrules="false" kind="src" path="/archive-commons"/>

(3)导入项目 
打开Eclipse,

  1. 选择File / Import... / Existing Projects Into Workspace,选择C:\Users\jHan\Developer\Heritrix3\source\heritrix3

(4)Eclipse中设置M2_REPO变量

  1. 选择 Project > Properties > Java Build path >
  2. 选择 Libraries 标签 > Add variable > Configure variables > New
  3. Name: M2_REPO
  4. Path: C:/Users/jHan/.m2/repository //路径修改为自己本地maven仓库的实际位置

(5)创建Debug/Run Configuration

    1. 打开 Run / Debug Configurations...
    2. 双击 Java Applications 创建一个新的
    3. 选择 Main class: org.archive.crawler.Heritrix
    4. 在Arguments标签中操作:
    5. 在Program arguments中输入: -a admin:admin -l dist/src/main/conf/logging.properties
    6. 在VM arguments中输入: -Dheritrix.development

Windows, Eclipse下开发Heritrix 3.1 (一)环境搭建的更多相关文章

  1. windows phone 8 开发系列(一)环境搭建

    一:前奏说明 本人一名普通的neter,对新玩意有点小兴趣,之前wp7出来的时候,折腾学习过点wp7开发,后来也没怎么用到(主要对微软抛弃wp7的行为比较不爽),现在wp8已经出来一段时间了,市场上也 ...

  2. Windows使用WxWidgets开发界面(c++)环境搭建

    一直想学习wxWidgets,之前使用的都是wxPython,现在终于鼓起勇气学习这个了,发现原来是基于vc6.0开发的.所以最好的学习办法就是安装vistual studio 2010,方便学习看代 ...

  3. 【转】如何在eclipse下配置Heritrix

    如何配置在eclipse下配置Heritrix 在其他帖子上看到有Eclipse 配置 Heritrix 1.14.4的文章,这里有很多内容是引用自那里.如http://extjs2.javaeye. ...

  4. 4-1eclipse & 4-2在eclipse下开发Java

    ecplise是一款继承的开发工具,可以开发我们的java程序. 下载地址: https://www.eclipse.org/downloads/ 视频中ecplise的版本 安装Ecplise: 默 ...

  5. Android开发使用控件入门--环境搭建

    Android开发使用控件入门--环境搭建 软件名称(,梦,,想.CAD  ,控件) 1. 环境搭建: 3 1.1. 安装Eclipse 3 1.2. 下载JDK 3 1.3. 下载Android S ...

  6. Windows Server 2003 IIS6.0+PHP5(FastCGI)+MySQL5环境搭建教程

    准备篇 一.环境说明: 操作系统:Windows Server 2003 SP2 32位 PHP版本:php 5.3.14(我用的php 5.3.10安装版) MySQL版本:MySQL5.5.25 ...

  7. Ubuntu下nginx+uwsgi+flask的执行环境搭建

    选择web framwork是个非常艰难的事情, 主要分为轻量级和重量级框架. 因为没有搭建站点这样的须要, 所以回避SSH, Django这样的框架, 而选择一个轻量级框架. 自己也比較青睐pyth ...

  8. Linux下Jenkins+git+gradle持续集成环境搭建

    Linux下Jenkins+git+gradle持续集成环境搭建 来源:IT165收集  发布日期:2014-08-22 21:45:50 我来说两句(0)收藏本文   一.项目介绍 和 linux ...

  9. arcgis api for flex 开发入门(一)环境搭建

    http://www.cnblogs.com/wenjl520/archive/2009/06/02/1494514.html arcgis api for flex 开发入门(一)环境搭建arcgi ...

随机推荐

  1. Matlab实现K-Means聚类算法

    人生如戏!!!! 一.理论准备 聚类算法,不是分类算法.分类算法是给一个数据,然后判断这个数据属于已分好的类中的具体哪一类.聚类算法是给一大堆原始数据,然后通过算法将其中具有相似特征的数据聚为一类. ...

  2. C#读取Excel五种方式的体会

    原地址: http://blog.csdn.net/dapengbusi/article/details/38117817 http://blog.csdn.net/dapengbusi/articl ...

  3. android ExpandableListActivity的使用

    package com.example.keKuoZhanLieBiao; import android.app.ExpandableListActivity; import android.os.B ...

  4. [状压dp]HDOJ4539 郑厂长系列故事——排兵布阵

    中文题,题意不再赘述 对于“?”这一格,它所能攻击到的(曼哈顿距离为2的) 前方的 即“√”的四个位置 那么与此格有关的即它前方两行(即状压这两行) 首先预处理每行能满足的: i 和(i<< ...

  5. SSH框架中配置Hibernate使用proxool连接池

    一.导入proxool.jar包 案例用的是proxool-0.8.3.jar,一般通过MyEclipse配置的SSH都会包含这个jar,如果没有,就去网上搜下下载导入就好了. 二.新建Proxool ...

  6. -fembed-bitcode is not supported on versions of iOS prior to 6.0 问题修复

    参考一下网址 http://stackoverflow.com/questions/30867544/fembed-bitcode-is-not-supported-on-versions-of-io ...

  7. hadoop2.2编程: SequenceFileWritDemo

    import java.io.IOException; import java.net.URI; import org.apache.hadoop.fs.FileSystem; import org. ...

  8. 登陆与注册以及Session

    Session  保存状态是在 登陆窗口  检查用户密码的动作上执行 .Models namespace 注册与登陆以及Session.Models { public class UserBF { p ...

  9. 利用if else判断是否及格

    static void Main(string[] args)        {            while (true)            {                string ...

  10. bzoj2763

    首先是稀疏图,不难想到dij+heap 观察题目可以知道,0<=k<=10; 所以比较裸的想法就是,d[i,j]表示已经免费了i条线路后到达j的最短路 容易得到 d[i,j]:=min(d ...