Hadoop2.6.0伪分布环境搭建
用到的软件:
一、安装jdk:
1、要安装的jdk,我把它拷在了共享文件夹里面。
(用优盘拷也可以)
2、我把jdk拷在了用户文件夹下面。
(其他地方也可以,不过路径要相应改变)
3、执行复制安装解压命令:
解压完毕:
查看解压的文件夹:
4、配置 环境变量:
写入如下5行代码:
使配置生效:
5、查看安装的jdk:
java -version
java
javac
二、SSH免密码登陆:
1、安装SSH:
2、是否生成 .ssh
目录:
3、如果没有生成,自己手动创建一个 .ssh 目录:
生成的 .ssh 目录:
4、生成公钥与私钥:
效果如下:
5、将公钥加入到用于认证的公钥文件中:
6、免密码登陆:
效果:
Ubuntu 免密码登陆,SSH配置完。
三、安装配置Hadoop:
1、复制安装解压Hadoop
:
解压完毕效果:
2、配置 etc/profile
3、配置 hadoop-env.sh
进入
4、修改hadoop-2.6.0文件权限为用户权限:
默认没有mapred-site.xml文件,复制mapred-site.xml.template一份,并把名字改为mapred-site.xml
5、配置下面4个重要文件:
mapred-site.xml
core-site.xml
hdfs-site.xml
yarn-site.xml
6、格式化:
格式化部分效果:
7、启动:
先启动 start-dfs.sh:
效果:
再启动 start-yarn.sh:
效果:
关闭hadoop:
(注:也可以 sbin/start-all.sh: 建议分开启动。)效果一样,如下:
8、查看Web页面信息:
至此,hadoop-2.6.0伪分布配置成功。
附录:文字版
一. ubuntu下JDK的安装:
见Ubuntu中安装配置jdk。
二. ubuntu下安装ssh:
1. $ sudo apt-get install openssh-server (用此方法安装不成功,参考在Ubuntu中配置SSH)
2. 启动ssh:/etc/init.d/ssh start
3. $ ps -e | grep ssh 来验证是否启动sshserver
4. 免密码化
$ ssh-keygen -t rsa //生成密钥对
一直按Enter键,就会按照默认的选项将生成的密钥对保存在.ssh/id_rsa文件中。
$cd .ssh //进入.ssh目录
$cp id_rsa.pub authorized_keys
$ssh localhost
三. ubuntu下安装hadoop:
1. 下载hadoop-0.20.2.tar.gz,放在/opt下解压
2. 修改hadoop配置文件
conf/hadoop-env.sh 修改JAVA_HOME选项:
export JAVA_HOME=/usr/java/jdk1.6.0_24,一定记得去除前面的#
3. 伪分布式单机配置
conf/core-site.xml
<?xml version="1.0"?>
<?xml-stylesheet
type="text/xsl" href="configuration.xsl"?>
<!-- Put
site-specific property overrides in this file. -->
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
conf/hdfs-site.xml:
<?xml version="1.0"?>
<?xml-stylesheet
type="text/xsl" href="configuration.xsl"?>
<!-- Put
site-specific property overrides in this file. -->
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.name.dir</name> //为了保证每次重启不用格式化
<value>/opt/hadoop-0.20.2/rq</value> //namenode,此处设置非常重要
</property>
<property>
<name>dfs.data.dir</name>
<value>/opt/hadoop-0.20.2/rq/data</value>
</property>
</configuration>
conf/mapred-site.xml:
<?xml version="1.0"?>
<?xml-stylesheet
type="text/xsl" href="configuration.xsl"?>
<!-- Put
site-specific property overrides in this file. -->
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
5. 创建hdfs文件系统
$ bin/hadoop namenode -format
6. 启动hadoop
需要先启动ssh: $ /etc/init.d/ssh start
$ bin/start-all.sh
7. 在hadoop下创建test目录,然后建立file1.txt file2.txt 写入几个单词;将hadoop/test下的测试文件上传到hadoop文件系统中
$ bin/hadoop dfs -put ./test input
8. 运行wordCount例子
$ bin/hadoop jar hadoop-0.20.2-examples.jar
wordcount input output
9. 把结果从dfs上拷贝下来
$ bin/hadoop dfs -get output output
10. 查看结果
$ cat output/* 也可以直接查看 $
bin/hadoop dfs -cat output/*
11. 停止hadoop运行
$ bin/stop-all.sh
12. 关闭ssh-server
$ /etc/init.d/ssh stop
Hadoop2.6.0伪分布环境搭建的更多相关文章
- Hadoop2.5.0伪分布式环境搭建
本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤.首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户.安装JDK.关闭防火墙等. 一.创建hadoo ...
- hadoop-2.7.1伪分布环境搭建
1.准备Linux环境 1.0 点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet i ...
- 在Win7虚拟机下搭建Hadoop2.6.0伪分布式环境
近几年大数据越来越火热.由于工作需要以及个人兴趣,最近开始学习大数据相关技术.学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘. 第一篇,在win7虚拟机下搭建hadoop ...
- Hadoop之伪分布环境搭建
搭建伪分布环境 上传hadoop2.7.0编译后的包并解压到/zzy目录下 mkdir /zzy 解压 tar -zxvf hadoop.2.7.0.tar.gz -C /zzy 配置hado ...
- 分享一份关于Hadoop2.2.0集群环境搭建文档
目录 一,准备环境 三,克隆VM 四,搭建集群 五,Hadoop启动与测试 六,安装过程中遇到的问题及其解决方案 一,准备环境 PC基本配置如下: 处理器:Intel(R) Core(TM) i5-3 ...
- hive-2.2.0 伪分布式环境搭建
一,实验环境: 1, ubuntu server 16.04 2, jdk,1.8 3, hadoop 2.7.4 伪分布式环境或者集群模式 4, apache-hive-2.2.0-bin.tar. ...
- Hadoop.2.x_伪分布环境搭建
一. 基本环境搭建 1. 设置主机名.静态IP/DNS.主机映射.windows主机映射(方便ssh访问与IP修改)等 设置主机名: vi /etc/sysconfig/network # 重启系统生 ...
- Spark2.4.0伪分布式环境搭建
一.搭建环境的前提条件 环境:ubuntu-16.04 hadoop-2.6.0 jdk1.8.0_161. spark-2.4.0-bin-hadoop2.6.这里的环境不一定需要和我一样,基本版 ...
- Ubuntu15.10下Hadoop2.6.0伪分布式环境安装配置及Hadoop Streaming的体验
Ubuntu用的是Ubuntu15.10Beta2版本,正式的版本好像要到这个月的22号才发布.参考的资料主要是http://www.powerxing.com/install-hadoop-clus ...
随机推荐
- 使用SQL语句创建SQL数据脚本(应对万网主机部分不支持导出备份数据)
1.查询待导出表Ad中的数据. SELECT * FROM [DB_Temp].[dbo].[Ad] 2.编写存储过程. --将表数据生成SQL脚本的存储过程 CREATE PROCEDURE dbo ...
- css3中变形与动画(一)
css3制作动画的几个属性:变形(transform),过渡(transition)和动画(animation). 首先介绍transform变形. transform英文意思:改变,变形. css3 ...
- 2016-2017 ACM-ICPC, NEERC, Southern Subregional Contest (Online Mirror, ACM-ICPC Rules, Teams Preferred)
A 思路: 贪心,每次要么选两个最大的,要么选三个,因为一个数(除了1)都可以拆成2和3相加,直到所有的数都相同就停止,这时就可以得到答案了; C: 二分+bfs,二分答案,然后bfs找出距离小于等于 ...
- vector3.forward和transform.forward的区别!
http://blog.163.com/bowen_tong/blog/static/20681717420146654927791/ vector3.forward和transform.forwar ...
- [No000038]操作系统Operating Systems -CPU
管理CPU ,先要使用CPU… CPU 的工作原理 CPU上电以后发生了什么? 自动的取指 — 执行 CPU 怎么工作? CPU怎么管理? 管理CPU 的最直观方法 设好PC 初值就完事! 看看这样做 ...
- h5中websocket
ajax的数据传输是单向的,客户端和服务端没有连接-----客户端建立连接发送请求----服务器端沿着建立的连接返回相应----断开连接 websocket则是可以在客户端和服务器端进行双向的数据接收 ...
- Linode Centos6.5从零开始装环境...流水账
安装JDK 下载. 先通过oracle网站, 下载, 得到link后, 在linode命令行里wget, 速度飞快, 但是文件名要改下. 其中JDK6是.bin, 其他都是tar.gz, bin直接执 ...
- VS XML注释
1.<c> <c>text</c> 其中: text 希望将其指示为代码的文本. 备注 <c> 标记为您提供了一种将说明中的文本标记为代码的方法.使用 ...
- C#获取文件MD5字符串
备注 哈希函数将任意长度的二进制字符串映射为固定长度的小型二进制字符串.加密哈希函数有这样一个属性:在计算不大可能找到散列为相同的值的两个不同的输入:也就是说,两组数据的哈希值仅在对应的数据也匹配时才 ...
- OSWatcher Black Box
Linux监控工具介绍系列--OSWatcher Black Box OSWatcher Balck Box简介 OSWatcher Black Box (oswbb)是Oracle开发.提供的一个小 ...