29.Hadoop之HDFS集群搭建笔记

0.修改IP,主机名,hosts文件

setup 修改网卡IP

service network restart 重启网络服务使IP生效

vim /etc/sysconfig/network修改主机名

vim /etc/hosts/修改hosts文件

192.168.126.128 hadoop001

192.168.126.129 hadoop002

192.168.126.130 hadoop003

192.168.126.131 hadoop004

1.安装jdk环境

alt + p 打开远程连接SecureCRT远程传输工具sftp put c:/........tar.gz 把win上软件传到linux

mkdir -p /java/jdk 建多级文件夹

tar -zxvf jdk----.tar.gz -C /java/jdk 解压jdk到指定路径

vim /etc/profile 修改全局环境变量

export JAVA_HOME=/java/jdk/jdk1.7.0_65

export PATH=$JAVA_HOME/bin:$PATH

source /etc/profile重新加载配置文件

echo$JAVA_HOME打印变量JAVA_HOME

java -version查看环境变量配置是否成功

安装protobuf

tar -zxvf protobuf-2.5.0.tar.gz

cd protobuf-2.5.0

./configure --prefix=/opt

配置环境变量加入/opt/bin

protoc -–version

2.安装Hadoop

tar -zxvf hadoop-2.4.1.tar.gz -C /java/解压Hadoop

ls lib/native/查看解压目录下有哪些文件

cd etc/hadoop/进入配置文件目录

vim hadoop-env.sh修改配置文件环境变量(export JAVA_HOME=/java/jdk/jdk1.7.0_65)

*-site.xml*

vim core-site.xml修改配置文件(去官网找参数含义)

<name>fs.defaultFS</name>

<value>hdfs://hadoop001:9000<value>

</property>

<name>hadoop.tmp.dir</name>

<value>/java/hadoop-2.4.1/tmp<value>

</property>

</configuration>

vim hdfs-site.xml修改hdfs配置文件

<name>dfs.replication</name>

</property>

</configuration>

cp mapred-site.xml.template mapred-site.xml复制一份配置文件样本

vim mapred-site.xml修改mapreduce配置文件

<name>mapreduce.framework.name</name>

</property>

</configuration>

vim yarn-site.xml配置yarn配置文件,也可以配置主机名,前提是修改hosts文件映射

<name>yarn.resourcemanager.hostname</name>

<value>hadoop001</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

vim slaves配置从节点(可以是主机名)

192.168.126.128

192.168.126.129

192.168.126.130

scp /java/hadoop-2.4.1/ root@192.168.126.129:/java/hadoop-2.4.1/复制到其他机器

cd /java/hadoop-2.4.1/bin

./hadoop namenode -format格式化HDFS文件系统(建文件和文件夹)

成功:INFO common.Storage: Storage directory /java/hadoop-2.4.1/tmp/dfs/name has been successfully formatted

3.启动

jps看java进程,此时什么都没有

cd sbin/到sbin下找启动命令

./start-dfs.sh启动hdfs

[root@hadoop001 sbin]# jps

2488 NameNode

2746 SecondaryNameNode

2872 Jps

2601 DataNode

[root@hadoop002 ~]# jps

2422 DataNode

2485 Jps

4.启动hdfs客户端

cd /java/hadoop-2.4.1/bin进入bin

./hdfs dfs -ls /查看hsfs /下内容

./hdfs dfs -put /root/install.log hdfs://hadoop001:9000/向hdfs文件系统存入文件(每块128M)

./hdfs dfs -ls /查看hsfs /下内容

ls /java/hadoop-2.4.1/tmp/dfs/查看文件保存位置(namenode,datanode)

ls /java/hadoop-2.4.1/tmp/dfs/(datanode)只有data文件夹

cd /java/hadoop-2.4.1/tmp/dfs/data/current/BP-343820156-192.168.126.128-1443868868316/current/finalized查看文件分了几块

./hdfs dfs -get hdfs://hadoop001:9000/install.log从hdfs上把文件下载下来(get后面指定下载的目录)

原理:

touch hadoop.tar.gz建一个空文件

cat block1 >> hadoop.tar.gz把block追加到hadoop.tar.gz

cat block2 >> hadoop.tar.gz 把block2追加到hadoop.tar.gz

./hdfs dfshdfs其他命令

./hdfs dfs -chown tangwan:hadoop /install.log改变hdfs文件用户所有者和组

./hdfs dfs -ls /install.log查看更改后状态

./hdfs dfs -chmod 600 /install.log更改权限

./hdfs dfs -ls /查看权限

改权限后用户依旧可以下载但是如果建一个文件夹给权限,就只能是指定权限用户上传

./hdfs dfs -df /查看hdfs还剩多少空间kb

./hdfs dfs -df -h /查看hdfs还剩多少空间M,G

./hdfs dfs -mkdir -p /aaa/bbb在hdfs创建文件夹

./hadoop fs -du -s / #查看hdfs占用空间

停止hdfs:

/java/hadoop-2.4.1/sbin进入sbin

./stop-dfs.sh停止hdfs

hadoop001:50070浏览器界面(可以下载不可以上传)

来自为知笔记(Wiz)

29.Hadoop之HDFS集群搭建笔记的更多相关文章

Hadoop基础-HDFS集群中大数据开发常用的命令总结
Hadoop基础-HDFS集群中大数据开发常用的命令总结作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本盘博客仅仅列出了我们在实际生成环境中常用的hdfs命令,如果想要了解更多, ...
大数据-HDFS 集群搭建的配置文件
1.HDFS简单版集群搭建相关配置文件 1.core-site.xml文件 <property> <name>fs.defaultFS</name> <val ...
hadoop高可用集群搭建小结
hadoop高可用集群搭建小结1.Zookeeper集群搭建2.格式化Zookeeper集群 (注:在Zookeeper集群建立hadoop-ha,amenode的元数据)3.开启Journalmno ...
hadoop namenode HA集群搭建
hadoop集群搭建(namenode是单点的) http://www.cnblogs.com/kisf/p/7456290.html HA集群需要zk, zk搭建:http://www.cnblo ...
大数据之Hadoop完全分布式集群搭建
1.准备阶段 1.1.新建三台虚拟机 Hadoop完全分市式集群是典型的主从架构(master-slave),一般需要使用多台服务器来组建.我们准备3台服务器(关闭防火墙.静态IP.主机名称).如果没 ...
从零自学Hadoop(06)：集群搭建
阅读目录序集群搭建监控系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序上一 ...
hadoop伪分布式集群搭建与安装（ubuntu系统）
1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链 ...
hadoop HA分布式集群搭建
概述 hadoop2中NameNode可以有多个(目前只支持2个).每一个都有相同的职能.一个是active状态的,一个是standby状态的.当集群运行时,只有active状态的NameNode是正 ...
1、hadoop HA分布式集群搭建
概述 hadoop2中NameNode可以有多个(目前只支持2个).每一个都有相同的职能.一个是active状态的,一个是standby状态的.当集群运行时,只有active状态的NameNode是正 ...

随机推荐

Issue 3：数据处理基本认识
介绍传统数据库对数据处理一般都分成两类:OLTP和OLAP. 数据分析(OLAP)的前提条件是要准备数据. 然后才是具体的数据分析,对此,可以分为统计型的数据分析和挖掘性的数据分析. 最后对分析结果 ...
[Android Tips] 23. How to fail/stop Gradle task immediately if some conditions are not met
throw new GradleException("conditions are not met") 参考 How to fail/stop task immediately i ...
git tag — 标签相关操作
标签可以针对某一时间点的版本做标记,常用于版本发布. 列出标签 $ Git tag # 在控制台打印出当前仓库的所有标签$ git tag -l 'v0.1.*' # 搜索符合模式的标签打标签 gi ...
VMware 12 CentOS Minimal 安装VMwareTools 找不到头文件kernelheaders
输入命令: yum install kernel-headers 安装vmware-tools时提示需要kernel headers 输入命令: yum install kernel-devel
HTML5元素、属性和格式化
Java 线程的转换及状态
线程的状态转换是线程控制的基础. 线程状态总的可分为五大状态:分别是生.死.可运行.运行.等待/阻塞.用一个图来描述如下: 1.新建状态(New):新创建了一个线程对象. 2.就绪状态(Runnabl ...
开通博客的第一天上传我的C#基础笔记，个人觉得很好用。
1.索引器 string arrStr = "sddfdfgfh"; 索引器的目的就是为了方便而已,可以在该类型的对象后面直接写[]访问该对象里面的成员 Console.Wr ...
【转】Delphi+Halcon实战一：两行代码识别QR二维码
Delphi+Halcon实战一:两行代码识别QR二维码感谢网友:绝代双椒( QQ号应原作者要求隐藏了:xxxx6348)的支持本文是绝代双椒的作品,因为最近在忙zw量化培训,和ziwang.co ...
html5，video元素
<video src="1.mp4" controls="" width="500" height="300" ...
(temp)catch ip
String str = "192.168.1.100"; String[] ipStr = str.split("\\."); ]; ; i < ; i ...

29.Hadoop之HDFS集群搭建笔记

29.Hadoop之HDFS集群搭建笔记的更多相关文章

随机推荐

热门专题