NUTCH2.3 hadoop2.7.1 hbase1.0.1.1 solr5.2.1部署(一）

Precondition:

hadoop 2.7.1

Nutch 2.3

hbase 1.0.1.1 / hbase 0.98.13

solr 4.8.1

Linux version 3.16.0-4-amd64

jdk1.8.0_45

hadoop编译部署

1. 安装相关软件

apt-get install ssh rsync

apt-get install openssh-server

apt-get install maven

apt-get install autoconf automake libtool cmake zlib1g-dev pkg-config libssl-dev

hadoop 使用openjdk可能导致问题，必须使用sun jdk。也就是不能“apt-get install default-jdk”

这篇文章使用的都是jdk1.8.0_45

hadoop 须要使用protobuf2.5，不是最新的2.6，能够从我的资源里面下载，网上也有。

执行protoc 2.5 的时候须要加上export LD_LIBRARY_PATH=/usr/local/lib

2. ssh免password登录，网上有非常多參考

1) cd /root/

2) ssh-keygen -t rsa

/root/.ssh/下生成id_rsa和id_isa.pub两个文件

3) ssh-copy-id -i .ssh/id_rsa.pub root@192.168.1.106

将本机id_isa.pub复制到对方。

4) ssh 192.168.1.106

5) 遇到权限问题。能够尝试：

chmod 700 -R .ssh

chmod 644 /root/.ssh/authorized_keys

3. 编译hadoop前准备

export LD_LIBRARY_PATH=/usr/local/lib

export JAVA_HOME=/disk2/java/jdk1.8.0_45

export JRE_HOME=${JAVA_HOME}/jre

export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

export PATH=${JAVA_HOME}/bin:$PATH

4. mvn clean package -Pdist,native -DskipTests -Dtar

mvn可能由于下载挂住。停止再执行一下mvn package -Pdist,native -DskipTests -Dtar就好了

将编译好的tar文件解压就可以

5. 部署前准备，两台机器192.168.1.105(datanode) / 192.168.1.106（namenode / datanode）

下面改动都是在192.168.1.106上面改动，然后scp到另外机器

/etc/profile

export JAVA_HOME=/disk2/java/jdk1.8.0_45

export HADOOP_HOME=/disk2/hadoop/hadoop-2.7.1

export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH

6. $HADOOP_HOME/etc/hadoop/hadoop-env.sh

该文件是hadoop执行基本环境的配置。须要改动的为java虚拟机的位置。

export JAVA_HOME=${JAVA_HOME} =>

export JAVA_HOME=/disk2/java/jdk1.8.0_45

7. $HADOOP_HOME/etc/hadoop/yarn-env.sh

该文件是yarn框架执行环境的配置，相同须要改动java虚拟机的位置。

export JAVA_HOME=/disk2/java/jdk1.8.0_45

8. $HADOOP_HOME/etc/hadoop/slaves

直接输入机器IP就可以

192.168.1.105

192.168.1.106

9.參考改动：

$HADOOP_HOME/etc/hadoop/core-site.xml

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://192.168.1.106:9000</value>

</property>

</configuration>

$HADOOP_HOME/etc/hadoop/hdfs-site.xml

<configuration>

		<property>

			<name>dfs.http.address</name>

			<value>192.168.1.106:50070</value>

		</property>

		<property>

			<name>dfs.namenode.secondary.http-address</name><value>192.168.1.106:50090</value>

		</property>

		<property>

			<name>dfs.replication</name>

			<value>1</value>

		</property>

        <property>

                <name>dfs.name.dir</name>

                <value>/disk2/hadoop/hdfs/name</value>

        </property>

        <property>

                <name>dfs.data.dir</name>

                <value>/disk2/hadoop/hdfs/data</value>

        </property>

        <property>

                <name>dfs.permissions</name>

                <value>false</value>

       </property>

</configuration>

$HADOOP_HOME/etc/hadoop/mapred-site.xml

<configuration>

        <property>

                <name>mapred.job.tracker</name>

                <value>192.168.1.106:9001</value>

        </property>

        <property>

                <name>mapred.system.dir</name>

                <value>/disk2/hadoop/hdfs/mapred.system.dir</value>

        </property>

        <property>

                <name>mapred.local.dir</name>

                <value>/disk2/hadoop/hdfs/mapred.local.dir</value>

        </property>

</configuration>

10. 创建必须文件夹

mkdir -p /disk2/hadoop/hdfs/mapred.local.dir

mkdir -p /disk2/hadoop/hdfs/mapred.system.dir

mkdir -p /disk2/hadoop/hdfs/name

mkdir -p /disk2/hadoop/hdfs/data

11.部署到其它机器

scp /etc/profile 192.168.1.105:/etc/

scp -r hadoop-2.7.1/ 192.168.1.105:/disk2/hadoop/

12. 格式化namenode

bin/hdfs namenode -format

13. 启动

sbin/start-all.sh

14:測试

http://192.168.1.106:50070

http://192.168.1.106:8088

应该都能訪问

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar pi 20 10

NUTCH2.3 hadoop2.7.1 hbase1.0.1.1 solr5.2.1部署(一）的更多相关文章

NUTCH2.3 hadoop2.7.1 hbase1.0.1.1 solr5.2.1部署(三）
Precondition: hadoop 2.7.1 hbase 0.98.13 solr 5.2.1 / Apache Solr 4.8.1 http://archive.apache.org ...
NUTCH2.3 hadoop2.7.1 hbase1.0.1.1 solr5.2.1部署(二）
Precondition: hadoop 2.7.1 hbase 1.0.1.1 / hbase 0.98.13 192.168.1.106 ->master 192.168.1.105 ...
hadoop2.6.0 + hbase-1.0.0 伪分布配置
1 基本配置主机名: 192.168.145.154 hadoop2 ======= 2 etc/hadoop下文件配置 1)core-site.xml <configuration> ...
Hadoop2.7.5+Hbase1.4.0完全分布式
Hadoop2.7.5+Hbase1.4.0完全分布式一.在介绍完全分布式之前先给初学者推荐两本书:<Hbase权威指南>偏理论<Hbase实战>实战多一些二.在安装完全分布 ...
Ubuntu 14.10 下ZooKeeper+Hadoop2.6.0+HBase1.0.0 的HA机群高可用配置
1 硬件环境 Ubuntu 14.10 64位 2 软件环境 openjdk-7-jdk hadoop 2.6.0 zookeeper-3.4.6 hbase-1.0.0 3 机群规划 3.1 zoo ...
mac下安装伪分布hadoop2.6.0和hbase1.0.1.1
1.安装JDK,我安装的是java1.7 2.创建管理员账户 3.安装ssh服务(如果已有跳过此步) 4.ssh无密码验证登陆以上过程略,可参考ubuntu下安装hadoop一文. 5.下载并解压h ...
Hadoop2.7.3+HBase1.2.5+ZooKeeper3.4.6搭建分布式集群环境
Hadoop2.7.3+HBase1.2.5+ZooKeeper3.4.6搭建分布式集群环境一.环境说明个人理解:zookeeper可以独立搭建集群,hbase本身不能独立搭建集群需要和hadoo ...
hadoop: hbase1.0.1.1 伪分布安装
环境:hadoop 2.6.0 + hbase 1.0.1.1 + mac OS X yosemite 10.10.3 安装步骤: 一.下载解压到官网 http://hbase.apache.org ...
HBase1.0以上版本的API改变
HBase1.0以上版本已经废弃了 HTableInterface,HTable,HBaseAdmin等API的使用,新增了一些API来实现之前的功能: Connectioninterface: Co ...

随机推荐

static方法调用
Static方法调用,类名.方法名 int number = Integer.ParseInt(String ); 将字符串参数作为有符号的十进制整数进行解析将数字解析成字节数组 Character ...
Pointcut is not well-formed: expecting 'name pattern' at character position 36
Pointcut is not well-formed: expecting 'name pattern' at character position 36 学习了:http://blog.csdn. ...
PyQt: LineEdit的智能输入提示
使用的的类是QtGui.QCompleter from PyQt4 import QtGui,QtCore str = QtCore.QStringList(['a','air','airbus']) ...
GIS+=地理信息+容器技术（2）——Dockers技术介绍
-------------------------------------------------------------------------------------- Blog: http ...
Android_通过Bugtags平台，方便測试人员提交bug及整个bug系统的管理
Bugtags 是什么? Bugtags 是一款缺陷发现及管理工具. 当您的 App 集成了 Bugtags SDK 后,測试人员就可直接在 App 里所见即所得的提交 Bug. SDK 会自己主动截 ...
php利用msqli访问数据库并实现分页，
<?php require_once 'login.php'; $num_rec_per_page=2; // 每页显示数量 //mysql_connect('localhost','jim', ...
89.[NodeJS] Express 模板传值对象app.locals、res.locals
转自:https://blog.csdn.net/Elliott_Yoho/article/details/53537437 locals是Express应用中 Application(app)对象和 ...
Linux mount挂载umount卸载
mount/umount挂载/卸载对于Linux用户来讲,不论有几个分区,分别分给哪一个目录使用,它总归就是一个根目录.一个独立且唯一的文件结构 Linux中每个分区都是用来组成整个文件系统的一部分 ...
lua中调用C++函数
lua中调用C++函数我们产品中提供了很多lua-C API给用户在lua中调用,之前一直没用深究其实现原理,只是根据已有的代码在编码.显然这不是一个好的习惯,没用达到知其所以然的目的. 一.基本原 ...
通过curl获取网页访问时间
curl -w %{time_namelookup}:%{time_connect}:%{time_starttransfer}:%{time_total}:%{speed_download}&quo ...

NUTCH2.3 hadoop2.7.1 hbase1.0.1.1 solr5.2.1部署(一）

NUTCH2.3 hadoop2.7.1 hbase1.0.1.1 solr5.2.1部署(一）的更多相关文章

随机推荐

热门专题