配置hadoop集群一

花了1天时间最终把环境搭建好了。整理了一下，希望对想学习hadoop的有所帮助。

资料下载：http://pan.baidu.com/s/1kTupgkn

包括了linux虚拟机。jdk, hadoop1.0

环境搭建准备工作：

hadoop_master 192.168.50.158

hadoop_slave 192.168.50.136

网络配置：

1：设置IP

2：重新启动网卡 service network restart. 验证命令 ifconfig

3：设置主机名 hostname hadoop 运行命令 vi /ect/sysconfig/network

4：把hostname和IP绑定

运行命令 vi /etc/hosts

192.168.50.158 master

192.168.50.136 slave

验证：ping hadoop

5：关闭防火墙 service iptables stop

关闭防火墙自己主动执行： chkconfig iptables off

验证： chkconfig --list |grep iptables

免password登陆ssh

1：ssh-keygen -t rsa产生的密钥位于~/.ssh目录中

2：cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys 本机就能够免password登录了

3：配置多机器面password登录

拷贝id_rsa.pub到须要登录的机器上： scp .ssh/id_rsa.pub chenlb@192.168.1.181:/home/chenlb/id_rsa.pub

把文件的内容追加到authorized_keys上 cat id_rsa.pub >> .ssh/authorized_keys

chmod 600 .ssh/authorized_keys

配置完毕后ssh ip(对方的电脑)

配置环境变量

1：拷贝jdk到/user/local文件夹下

2：运行命令 chmod u+x jdk*.bin

3：vi /etc/profile

export JAVA_HOME = /user/local/jdk

export PATH=.:$JAVA_HOME/bin:$PATH

让配置文件生效： source /etc/profile

安装 hadoop

1：tar -zxvf hadoop.tar.gz

2：改名字 mv hadoop.1.2 hadoop

3：vi /etc/profile

export HADOOP_NAME=/user/local/hadoop

path环境变量须要改动一下。

加入hadoop的bin

4：改动配置文件，配置文件在hadoop的conf文件夹下

hadoop-env.sh

export JAVA_HOME=/usr/local/jdk/

也能够配置垃圾回收机制：

比如，配置Namenode时,为了使其可以并行回收垃圾（parallelGC）。要把以下的代码增加到hadoop-env.sh :

export HADOOP_NAMENODE_OPTS="-XX:+UseParallelGC ${HADOOP_NAMENODE_OPTS}"

其他可定制的经常使用參数还包含：

HADOOP_LOG_DIR - 守护进程日志文件的存放文件夹。假设不存在会被自己主动创建。

HADOOP_HEAPSIZE - 最大可用的堆大小，单位为MB。

比方。1000MB。这个參数用于设置hadoop守护进程的堆大小。缺省大小是1000MB。

core-site.xml

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://hadoop0:9000</value>   定义HadoopMaster的URI和port

<description>change your own hostname</description>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop/tmp</value>

</property>

</configuration>

   hdfs-site.xml

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.permissions</name>

<value>false</value>

</property>

</configuration>

mapred-site.xml

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>hadoop0:9001</value> 

<description>change your own hostname</description>

</property>

</configuration>

配置完毕后。假设是配置集群就须要在配置文件下的slaves和masters配置相应的datanode和secordaryNamenode。

5：对hadoop进行格式化 hadoop namenode -format

格式化假设没有成功的话须要删除 /usr/local/hadoop/tmp目录

启动完毕后，能够输入 http://master:50070/dfshealth.jsp中能够查看到节点。

配置hadoop集群一的更多相关文章

Linux中安装配置hadoop集群
一. 简介参考了网上许多教程,最终把hadoop在ubuntu14.04中安装配置成功.下面就把详细的安装步骤叙述一下.我所使用的环境:两台ubuntu 14.04 64位的台式机,hadoop选择 ...
hadoop集群环境搭建之安装配置hadoop集群
在安装hadoop集群之前,需要先进行zookeeper的安装,请参照hadoop集群环境搭建之zookeeper集群的安装部署 1 将hadoop安装包解压到 /itcast/ (如果没有这个目录 ...
centos7配置hadoop集群
一:测试环境搭建规划: 主机名称 IP 用户 HDFS YARN hadoop11 192.168.1.101 hadoop NameNode,DataNode NodeManager hadoop1 ...
在 Linux 服务器上搭建和配置 Hadoop 集群
实验条件:3台centos服务器,jdk版本1.8.0,Hadoop 版本2.8.0 注:hadoop安装和搭建过程中都是在用户lb的home目录下,master的主机名为host98,slave的主 ...
安装和配置hadoop集群步骤
hadoop集群的安装步骤和配置 hadoop是由java语言编写的,首先我们肯定要在电脑中安装jdk,配置好jdk的环境,接下来就是安装hadoop集群的步骤了,在安装之前需要创建hadoop用户组 ...
linux配置hadoop集群
①安装虚拟机 ②为虚拟机添加共享文件右击已经安装好的虚拟机设置—>选项—>共享文件 ③配置映射 sudo nano /etc/network/interfaces 重启网络:sud ...
为Linux集群创建新账户，并配置hadoop集群
转自:http://blog.csdn.net/bluesky8640/article/details/6945776 之前装python.jdk.hadoop都是用的root账户,这是一个绝对的失策 ...
配置hadoop集群的lzo压缩
MR-Job中使用lzop详见MR案例:Job中使用Lzo压缩 1). 配置前的环境准备 # yum -y install lzo-devel zlib-devel gcc autoconf auto ...
在Ubuntu18.04下配置hadoop集群
服务器准备启动hadoop最小集群的典型配置是3台服务器, 一台作为Master, NameNode, 两台作为Slave, DataNode. 操作系统使用的Ubuntu18.04 Server, ...

随机推荐

Explaining difference between automaticallyAdjustsScrollViewInsets, extendedLayoutIncludesOpaqueBars, edgesForExtendedLayout
automaticallyAdjustsScrollViewInsets:在导航栏透明时用到 In your viewDidLoad method, add if([self respondsToSe ...
jmeter普通的接口测试
摘自:后知者.https://www.cnblogs.com/houzhizhe/p/6838731.html jmeter可以做接口测试,其中接口测试的简单操作包括做http脚本(发get/post ...
ThinkPHP---TP功能类之上传
[一]概论 (1)上传操作的核心操作:移动临时文件(move_upload_file),在ThinkPHP里封装了上传类Upload.class.php (2)上传类Upload.class.php代 ...
数塔(hdoj 2084,动态规划递推)
在讲述DP算法的时候,一个经典的例子就是数塔问题,它是这样描述的: 有如下所示的数塔,要求从顶层走到底层,若每一步只能走到相邻的结点,则经过的结点的数字之和最大是多少? 已经告诉你了,这是个DP的题目 ...
C++ Primer(第4版)-学习笔记-第3部分：类和数据抽象
第12章类每个类可以没有成员,也可以定义多个成员,成员可以是数据.函数或类型别名. 成员函数必须在类内部声明,可以在类内部定义,也可以在类外部定义.如果在类内部定义,就默认是内联函数. ...
Tomcat服务器启动后访问localhost:8080显示404的原因
原因:在eclipse中关联了Tomcat服务器重点来了,如果你是在eclipse中点击启动按钮启动的Tomcat 那么Tomcat不会默认部署它自己的测试项目(也就是大猫localhost:808 ...
第十二节：Web爬虫之MongoDB数据库安装与数据存储
MongoDB是一个基于分布式文件存储的数据库.由C++语言编写.旨在为WEB应用提供可扩展的高性能数据存储解决方案. MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功 ...
部署live555到云
1.下载live555源码: wget http://www.live555.com/liveMedia/public/live.2017.10.28.tar.gz 2.解压源码包: ...
将网络图片转换为base64
public static function htmlPdf() { $img_path = Env::get('ROOT_PATH').'/public/images/wechat/user.jpg ...
【Codeforces 1038D】Slime
[链接] 我是链接,点我呀:) [题意] 题意 [题解] 相当于让你确定每个数字前面的系数是-1还是+1 有个结论是这样每次和相邻的减的话, 任何出除了全"-1"和全"+ ...

配置hadoop集群一

配置hadoop集群一的更多相关文章

随机推荐

热门专题