Hadoop windows编译:

能够略过这一段,直接下载hadoo2.7.1 bin文件。我的资源里有终于生成的winutils.exe和一些native code,放在bin文件夹即可了

參考building.txt以及http://wiki.apache.org/hadoop/Hadoop2OnWindows,编译条件:

* Windows System - win8

* JDK 1.7+ - jdk1.8

* Maven 3.0 or later - maven 3.3

* Findbugs 1.3.9 (if running findbugs) - None

* ProtocolBuffer 2.5.0 - 2.5 build by vs2013

* CMake 2.6 or newer - cmake3.3

* Windows SDK 7.1 or Visual Studio 2010 Professional - vs2010

* Windows SDK 8.1 (if building CPU rate control for the container executor)

* zlib headers (if building native code bindings for zlib)

* Internet connection for first build (to fetch all Maven and Hadoop dependencies)

* Unix command-line tools from GnuWin32: sh, mkdir, rm, cp, tar, gzip. These

  tools must be present on your PATH.

1. Unix command-line tools: http://git-scm.com/download/win

PATH设置环境变量C:\Program Files (x86)\Git\cmd;C:\Program Files (x86)\Git\bin

想用gnuwin32的话,hosts文件须要加入(国内訪问不了)

216.34.181.96 getgnuwin32.sourceforge.net

2. protocolbuffer 2.5.0 能够用vs2010/vs2013编译,几个project须要加上 /FS

加上,#include <algorithm>

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast">

编译好的protoc.exe / libprotobuf.lib / libprotobuf-lite.lib / libprotoc.lib 放到c:/windows,打开CMD输入protoc,

3. 拷贝zlib1.dll(网上能够下载到,最好用1.2.7版本号的)到C:/windows

4. 按编译过程中提示的错误信息。把C:\Java\jdk1.8.0_51\lib\tools.jar复制到C:\Java\jdk1.8.0_51\lib\

5. 打开CMD。注意JAVA_HOME文件夹中不要有Program file这样有空格

CALL "%VS100COMNTOOLS%..\..\VC\bin\vcvars32.bat"

set Platform=Win32

set JAVA_HOME=C:\Java\jdk1.8.0_51

cd e:/hadoop-2.7.1-src

mvn package -Pdist,native-win -DskipTests -Dtar

6. mvn能够多试几次,终于tar文件在hadoop-dist\target\

启动Hadoop:

配置hadoop能够全然參照linux下配置,须要注意的是:

1. 涉及到本机文件夹的地方,加上file:///。否则 hdfs namenode -format 会失败

file:///e:/nutch/hdfs/name

2. 可能会提示Error: missing `server' JVM at `C:\Java\jdk1.8.0_51\bin\server\jvm.dll'.

将C:\Java\jdk1.8.0_51\jre\bin\server 文件夹复制到C:\Java\jdk1.8.0_51\bin\

eclipse导入Nutch2.3:

1. windows下编译,ant runtime和linux区别不大

2. 导入nutch2.3,网上有例程。ant runtime以后再导入例程

打开eclipse。new - java project - ,基本就

能够finish了,还会有一些bug:

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast">

3. Run as - java appliction, 选择InjectorJob

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast">

4. 执行成功,先执行hadoop

5. InjectorJob: java.lang.NullPointerException

 at java.lang.ProcessBuilder.start(Unknown Source)

,同一时候HADOOP_HOME/bin增加到PATH能够解决

也许须要重新启动一下eclipse:)



hadoop2.7.1 nutch2.3 二次开发windows环境的更多相关文章

  1. Selenium2学习-001-Selenium2 WebUI自动化Java开发 Windows 环境配置

    此文主要介绍 Selenium2 WebUI自动化Java开发 Windows 环境配置,供各位亲们参考,若有不足之处,敬请各位大神指正,非常感谢! 所需软件列表如下所示: 所属分类 具体名称 备注 ...

  2. 基于Java的Arc Engine二次开发的环境的配置

    1.软件准备 ArcGIS for Desktop 10.2, Arc engine, jdk-7u60-windows-i586,Eclipse Mar2 2.软件的安装 2.1 ArcGIS fo ...

  3. openfire二次开发eclipse环境搭建

    转自:http://blog.csdn.net/daigua245/article/details/7918243 1.将openfire源码项目解压到(如果是从SVN CO下来的则不用)eclips ...

  4. 消息队列的使用 RabbitMQ (二): Windows 环境下集群的实现

    一.RabbitMQ 集群的基本概念 一个 RabbitMQ 中间件(broker) 由一个或多个 erlang 节点组成,节点之间共享 用户名.虚拟目录.队列消息.运行参数 等, 这个 节点的集合被 ...

  5. MongoDB(二):在Windows环境安装MongoDB

    1. 在Windows环境安装 1.1 MongoDB下载 要在Windows上安装MongoDB,首先打开MongoDB官网:https://www.mongodb.com/download-cen ...

  6. RN开发-windows环境搭建

    1.安装jdk,sdk,C++运行环境(cygwin,Windows SDK,mingw),node.js和git 2.设置全局使用指定的镜像        打开git-cmd.exe         ...

  7. datax二次开发

    从hive抽取数据,写入hbase 一.datax插件hbase12xwriter开发 查看datax源码,发现有hbase094xwriter和hbase11xwriter源码,说明datax支持h ...

  8. Navisworks API 简单二次开发 (自定义工具条)

    在Navisworks软件运行的时候界面右侧有个工具条.比较方便.但是在二次开发的时候我不知道在Api那里调用.如果有网友知道请告诉我.谢谢. 我用就自己设置一个工具.界面比较丑!没有美工. 代码: ...

  9. [连载]《C#通讯(串口和网络)框架的设计与实现》- 12.二次开发及应用

    目       录 第十二章     二次开发及应用... 2 12.1        项目配制... 3 12.2        引用相关组件... 4 12.3        构建主程序... 5 ...

随机推荐

  1. 【转】4w+1h 教你如何做用户画像

    记得14年开始做用户画像的时候,对于用户画像完全没有概念,以为是要画一幅幅图画,经过两年多的学习和理解,渐渐的总结出了一些方法和技巧,在这里就通过4个W英文字母开头和1个H英文字母开头的单词和大家分享 ...

  2. LeetCode(3)Longest Substring Without Repeating Characters

    题目: Given a string, find the length of the longest substring without repeating characters. For examp ...

  3. PYDay2-linux基础\常用命令

    一.linux 理念 一切皆文件 二.常用命令(150) 2.1.rsync rsync是类unix系统下的数据镜像备份工具, 它的特性如下: 可以镜像保存整个目录树和文件系统. 可以很容易做到保持原 ...

  4. Course Machine Learning Note

    Machine Learning Note Introduction Introduction What is Machine Learning? Two definitions of Machine ...

  5. 【EF 1】EF实体框架 原理+实例

    一.知识回顾 到目前为止,自己学到的链接数据库操作已经经历了几个阶段,分别是:学生信息管理和(第一次)机房收费时的直接连接数据库操作表格,然后是机房个人重构中应用的操作实体,在其中还利用了一个很重要的 ...

  6. next_permutation

    实验了一下next_permutation 代码如下 #include <cstdio> #include <cstdlib> #include <cstring> ...

  7. 九度oj 题目1137:浮点数加法

    题目描述: 求2个浮点数相加的和 题目中输入输出中出现浮点数都有如下的形式:P1P2...Pi.Q1Q2...Qj对于整数部分,P1P2...Pi是一个非负整数 对于小数部分,Qj不等于0 输入: 对 ...

  8. UITableView点击切换状态分析

    原理:多选+点击动画 初始化和点击都调用的方法 - (void)changeStateAnimated:(BOOL)animated { //不需要动画,初始化的时候 if (animated == ...

  9. 【bzoj4200】[Noi2015]小园丁与老司机 STL-map+dp+有上下界最小流

    题目描述 小园丁 Mr. S 负责看管一片田野,田野可以看作一个二维平面.田野上有 nn 棵许愿树,编号 1,2,3,…,n1,2,3,…,n,每棵树可以看作平面上的一个点,其中第 ii 棵树 (1≤ ...

  10. UVa——1600Patrol Robot(A*或普通BFS)

    Patrol Robot Time Limit: 3000MS   Memory Limit: Unknown   64bit IO Format: %lld & %llu Descripti ...