29.Hadoop之HDFS集群搭建笔记

0.修改IP,主机名,hosts文件

setup 修改网卡IP

service network restart 重启网络服务使IP生效

vim /etc/sysconfig/network修改主机名

vim /etc/hosts/修改hosts文件

192.168.126.128 hadoop001

192.168.126.129 hadoop002

192.168.126.130 hadoop003

192.168.126.131 hadoop004

1.安装jdk环境

alt + p 打开远程连接SecureCRT远程传输工具sftp put c:/........tar.gz 把win上软件传到linux

mkdir -p /java/jdk 建多级文件夹

tar -zxvf jdk----.tar.gz -C /java/jdk 解压jdk到指定路径

vim /etc/profile 修改全局环境变量

export JAVA_HOME=/java/jdk/jdk1.7.0_65

export PATH=$JAVA_HOME/bin:$PATH

source /etc/profile重新加载配置文件

echo$JAVA_HOME打印变量JAVA_HOME

java -version查看环境变量配置是否成功

安装protobuf

tar -zxvf protobuf-2.5.0.tar.gz

cd protobuf-2.5.0

./configure --prefix=/opt

配置环境变量加入/opt/bin

protoc -–version

2.安装Hadoop

tar -zxvf hadoop-2.4.1.tar.gz -C /java/解压Hadoop

ls lib/native/查看解压目录下有哪些文件

cd etc/hadoop/进入配置文件目录

vim hadoop-env.sh修改配置文件环境变量(export JAVA_HOME=/java/jdk/jdk1.7.0_65)

*-site.xml*

vim core-site.xml修改配置文件(去官网找参数含义)

<name>fs.defaultFS</name>

<value>hdfs://hadoop001:9000<value>

</property>

<name>hadoop.tmp.dir</name>

<value>/java/hadoop-2.4.1/tmp<value>

</property>

</configuration>

vim hdfs-site.xml修改hdfs配置文件

<name>dfs.replication</name>

</property>

</configuration>

cp mapred-site.xml.template mapred-site.xml复制一份配置文件样本

vim mapred-site.xml修改mapreduce配置文件

<name>mapreduce.framework.name</name>

</property>

</configuration>

vim yarn-site.xml配置yarn配置文件,也可以配置主机名,前提是修改hosts文件映射

<name>yarn.resourcemanager.hostname</name>

<value>hadoop001</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

vim slaves配置从节点(可以是主机名)

192.168.126.128

192.168.126.129

192.168.126.130

scp /java/hadoop-2.4.1/ root@192.168.126.129:/java/hadoop-2.4.1/复制到其他机器

cd /java/hadoop-2.4.1/bin

./hadoop namenode -format格式化HDFS文件系统(建文件和文件夹)

成功:INFO common.Storage: Storage directory /java/hadoop-2.4.1/tmp/dfs/name has been successfully formatted

3.启动

jps看java进程,此时什么都没有

cd sbin/到sbin下找启动命令

./start-dfs.sh启动hdfs

[root@hadoop001 sbin]# jps

2488 NameNode

2746 SecondaryNameNode

2872 Jps

2601 DataNode

[root@hadoop002 ~]# jps

2422 DataNode

2485 Jps

4.启动hdfs客户端

cd /java/hadoop-2.4.1/bin进入bin

./hdfs dfs -ls /查看hsfs /下内容

./hdfs dfs -put /root/install.log hdfs://hadoop001:9000/向hdfs文件系统存入文件(每块128M)

./hdfs dfs -ls /查看hsfs /下内容

ls /java/hadoop-2.4.1/tmp/dfs/查看文件保存位置(namenode,datanode)

ls /java/hadoop-2.4.1/tmp/dfs/(datanode)只有data文件夹

cd /java/hadoop-2.4.1/tmp/dfs/data/current/BP-343820156-192.168.126.128-1443868868316/current/finalized查看文件分了几块

./hdfs dfs -get hdfs://hadoop001:9000/install.log从hdfs上把文件下载下来(get后面指定下载的目录)

原理:

touch hadoop.tar.gz建一个空文件

cat block1 >> hadoop.tar.gz把block追加到hadoop.tar.gz

cat block2 >> hadoop.tar.gz 把block2追加到hadoop.tar.gz

./hdfs dfshdfs其他命令

./hdfs dfs -chown tangwan:hadoop /install.log改变hdfs文件用户所有者和组

./hdfs dfs -ls /install.log查看更改后状态

./hdfs dfs -chmod 600 /install.log更改权限

./hdfs dfs -ls /查看权限

改权限后用户依旧可以下载但是如果建一个文件夹给权限,就只能是指定权限用户上传

./hdfs dfs -df /查看hdfs还剩多少空间kb

./hdfs dfs -df -h /查看hdfs还剩多少空间M,G

./hdfs dfs -mkdir -p /aaa/bbb在hdfs创建文件夹

./hadoop fs -du -s / #查看hdfs占用空间

停止hdfs:

/java/hadoop-2.4.1/sbin进入sbin

./stop-dfs.sh停止hdfs

hadoop001:50070浏览器界面(可以下载不可以上传)

来自为知笔记(Wiz)

29.Hadoop之HDFS集群搭建笔记的更多相关文章

Hadoop基础-HDFS集群中大数据开发常用的命令总结
Hadoop基础-HDFS集群中大数据开发常用的命令总结作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本盘博客仅仅列出了我们在实际生成环境中常用的hdfs命令,如果想要了解更多, ...
大数据-HDFS 集群搭建的配置文件
1.HDFS简单版集群搭建相关配置文件 1.core-site.xml文件 <property> <name>fs.defaultFS</name> <val ...
hadoop高可用集群搭建小结
hadoop高可用集群搭建小结1.Zookeeper集群搭建2.格式化Zookeeper集群 (注:在Zookeeper集群建立hadoop-ha,amenode的元数据)3.开启Journalmno ...
hadoop namenode HA集群搭建
hadoop集群搭建(namenode是单点的) http://www.cnblogs.com/kisf/p/7456290.html HA集群需要zk, zk搭建:http://www.cnblo ...
大数据之Hadoop完全分布式集群搭建
1.准备阶段 1.1.新建三台虚拟机 Hadoop完全分市式集群是典型的主从架构(master-slave),一般需要使用多台服务器来组建.我们准备3台服务器(关闭防火墙.静态IP.主机名称).如果没 ...
从零自学Hadoop(06)：集群搭建
阅读目录序集群搭建监控系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序上一 ...
hadoop伪分布式集群搭建与安装（ubuntu系统）
1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链 ...
hadoop HA分布式集群搭建
概述 hadoop2中NameNode可以有多个(目前只支持2个).每一个都有相同的职能.一个是active状态的,一个是standby状态的.当集群运行时,只有active状态的NameNode是正 ...
1、hadoop HA分布式集群搭建
概述 hadoop2中NameNode可以有多个(目前只支持2个).每一个都有相同的职能.一个是active状态的,一个是standby状态的.当集群运行时,只有active状态的NameNode是正 ...

随机推荐

working with fitnesse wiki pages
fitnesse提供一个简单易用的wiki创建一个web页面用于测试.测试页面有一个button,允许所有的测试在这个页面运行,因此任何人在任何时间都可以去这个页面点击这个按钮,查看测试是否通过.fi ...
ferret不能创建txt文本
设置文件夹权限为可读写也没用~郁闷中.
Android 偶遇小问题解决方案集合
1.Android 如何让EditText不自动获取焦点解决方案:找一个EditText的父级控件把EditText默认的行为截断了!设置 android:focusable="true& ...
Docker镜像的管理和创建
1. Docker镜像和Docker容器: Docker镜像实际上是一系列的文件系统,通常的Linux系统一般是两层文件系统,bootfs和rootfs,bootfs就是bootloader ...
linux搭建微型git服务器
1.安装git和git-core yum install git git-core -y 2.创建仓库 mkdir /home/git cd /home/git git init 3.设置可以远程pu ...
Oracle11完全卸载
1.停用oracle服务:进入计算机管理,在服务中,找到oracle开头的所有服务,右击选择停止 2.在开始菜单中,找到Universal Installer,运行Oracle Universal I ...
五步教你实现使用Nginx+uWSGI+Django方法部署Django程序
Django的部署可以有很多方式,采用nginx+uwsgi的方式是其中比较常见的一种方式. 在这种方式中,我们的通常做法是,将nginx作为服务器最前端,它将接收WEB的所有请求,统一管理请求.ng ...
List view优化
ListView 针对每个item,要求 adapter "返回一个视图" (getView),也就是说ListView在开始绘制的时候,系统首先调用getCount()函数,根据 ...
006_Salesforce Sharing 使用说明
Salesforce Sharing 使用说明背景说明:Salesforce共享实施记录和其它数据时,需要员工之间共享或多个用户在一个组织间的共享.然而,共享这些数据是有风险的,尤其是当它涉及到敏感 ...
Dynamics AX 2012 R2 无法创建类"Excel.Application"的COM对象
Reinhard在做一个Excel导入项目时,发现X++代码一旦执行到Excel组件部分,就会报如下错误: 无法创建类"Excel.Application"的COM对象.请 ...

29.Hadoop之HDFS集群搭建笔记

29.Hadoop之HDFS集群搭建笔记的更多相关文章

随机推荐

热门专题