Hadoop 伪分布式安装、运行测试例子
- centos 6.4 下载地址:http://pan.baidu.com/s/1geoSWuv【VMWare专用CentOS.rar】(安装打包好的VM压缩包)
- 并配置虚拟机网络连接为“仅主机模式”(使主机和虚拟机可以互通)
123456surootservice iptables stop#关闭防火墙service iptables status#验证是否关闭chkconfig iptables off#关闭防火墙的开机自动运行chkconfig –list |grepiptables#验证防火墙的开机自动运行vim/etc/sysconfig/selinux# 禁用selinux,将SELINUX=disabled
123hostname#查看当前主机名hostnamehadoop#设置主机名,本次生效vim/etc/sysconfig/network#修改HOSTNAME=hadoop,永久生效
12vim/etc/hosts#增加 192.168.17.100 hadoopreboot
adduser hadoop01passwd hadoop01设置密码:hadoop01却换root用户给hadoop01设置权限,设置允许root命令的用户
su rootchmod 751 /etc/sudoers #设置可读写vim /etc/sudoershadoop01 ALL=(ALL) ALL #在Allow root to run any commands anywhere 下添加一行直接使用root
123ssh-keygen -t rsa#回车,产生密钥,位于~/.ssh下cp~/.ssh/id_rsa.pub ~/.ssh/authorized_keys2#(或ssh-copy-id localhost)ssh localhost#验证,免密码登陆
123456789cd/usr/local/srcmkdirjavacdjavamkdirjdk#jdk解压到此处 sudo tar -zxvf xxxvim/etc/profile#配置环境变量,追加exportJAVA_HOME=/usr/local/src/java/jdkexportPATH=$PATH:$JAVA_HOME/binsource/etc/profile# 让配置生效java –version# 查看是否安装成功
12345678910111213141516171819202122232425cd/usr/local/srcmkdirhadoop# 解压hadoop压缩包到此处cdhadoopmkdirdatacddatamkdirtmp#存放临时目录运行时产生数据vim etc/hadoop/hadoop-env.sh# JAVA_HOME修改为实际路径JAVA_HOME=/usr/local/src/java/jdkvim etc/hadoop/core-site.xml#配置新增:配置hdfs访问的端口 8020(2.x以后支持8020)<property><name>fs.defaultFS</name><value>hdfs://hadoop:8020</value></property>#修改临时目录运行时产生数据的目录:(默认在tmp,在linux系统中可能回被删除)<property><name>hadoop.tmp.dir</name><value>/usr/local/src/hadoop/data/tmp</value></property>vim etc/hadoop/hdfs-site.xml# 配置默认副本的备份个数(一般是3个,这里伪分布式只要1份就可以)<property><name>dfs.replication</name><value>1</value></property>bin/hdfsnamenode -format# 格式化文件系统sbin/start-dfs.sh# 启动 jps查看启动进行情况,启动三个进程,namenode存储元数据,datanode存储数据sbin/stop-dfs.sh#关闭
12345678910111213mvetc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xmlvim etc/hadoop/mapred-site.xml#使mapreduce用yarn来调度<property><name>mapreduce.framework.name</name><value>yarn</value></property>vim etc/hadoop/yarn-site.xml#配置Reduce取数据的方式是shuffle<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property>sbin/start-yarn.sh# 启动( jsp可以看到多了两个进程 resourcesManage管理总的资源分配, NodeManage 管理该台节点的资源)sbin/stop-yarn.sh#关闭
关闭所有:stop-all.sh分别启动各个进程:执行的命令是“hadoop-daemon.sh start [进程名称]”,这种启动方式适合于单独增加
123456789cd/usr/local/src/hadoop/datavim words# 输入 hello a,hello bcd/usr/local/src/hadoopbin/hadoopfs -put/usr/local/src/hadoop/data/words/words# 把words上传到hdfs,# 可以在http://192.168.17.100:50070/看到 hdfd默认128M的超过的话回切分多个128M的快来处理bin/hadoopjar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount/words/out#运行demo#查看运行状态 http://192.168.17.100:8088bin/hadoopfs -ls/outbin/hadoopfs -cat/out/part-r-00000
1234567891011121314151617181920212223242526272829303132333435363738map阶段:输入数据:<0,"hello a"><8,"hello b">输出数据:map(key,value,context) {String line = value;
//hello aString[] words = value.split("\t");for(String word : words) {//hello// a// hello// bcontext.write(word,1);}}<hello,1><a,1><hello,1><b,1>reduce阶段(分组排序):输入数据:<a,1><b,1><hello,{1,1}>输出数据:reduce(key,value,context) {int sum = 0;String word = key;for(int i : value) {sum += i;}context.write(word,sum);}
Hadoop 伪分布式安装、运行测试例子的更多相关文章
- hadoop伪分布式安装之Linux环境准备
Hadoop伪分布式安装之Linux环境准备 一.软件版本 VMare Workstation Pro 14 CentOS 7 32/64位 二.实现Linux服务器联网功能 网络适配器双击选择VMn ...
- apache hadoop 伪分布式安装
1. 准备工作 1.1. 软件准备 1.安装VMWare 2.在VMWare上安装CentOS6.5 3.安装XShell5,用来远程登录系统 4.通过rpm -qa | grep ssh 检查cen ...
- 【Hadoop学习之二】Hadoop伪分布式安装
环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-3.1.1 伪分布式就 ...
- hadoop 伪分布式安装
0. 关闭防火墙 重启后失效 service iptables start ;#立即开启防火墙,但是重启后失效. service iptables stop ;#立即关闭防火墙,但是重启后失效. 重启 ...
- 基于centos6.5 hadoop 伪分布式安装
步骤1:修改IP 地址和主机名: vi /etc/sysconfig/network-scripts/ifcfg-eth0 如果该文件打开为空白文件代表你计算机上的网卡文件不是这个名称“ifcfg-e ...
- Hadoop伪分布式安装步骤(hadoop0.20.2版本)
最近在学习hadoop,自己下了个视频教程,他的教学版本是hadoop0.20.2版本,现在的最新版本都到了3.0了,版本虽然有点老,但是还是学了一下,觉得有借鉴的价值. 不废话了,开始介绍: 先说一 ...
- [大数据] hadoop伪分布式安装
注意:节点主机的hostname不要带"_"等字符,否则会报错. 一.安装jdk rpm -i jdk-7u80-linux-x64.rpm 配置java环境变量: vi + /e ...
- hadoop伪分布式安装
hadoop的伪分布安装:一台实体机或虚拟机的安装. 环境:Windows7.VMWare.CentOS 1.1 设置ip地址 说明:在CentOS中的网络的类型: 仅主机模式:虚拟机在Windows ...
- macbook 下hadoop伪分布式安装
1 准备原材料 1.1 jdk 1.8.0_171(事先安装并配置环境变量HAVA_HOME,PATH) 1.2 Hadoop 2.8.3 2 免密登陆配置(否则安装过程需要不断输入密码) 2.1 ...
随机推荐
- [bzoj 1293] [SCOI2009] 生日礼物
传送门(bzoj) 传送门(luogu) 题目: Description 小西有一条很长的彩带,彩带上挂着各式各样的彩珠.已知彩珠有N个,分为K种.简单的说,可以将彩带考虑为x轴,每一个彩珠有一个对应 ...
- linux-非root用户运行tomcat
# 前言:为什么要使用非root用户运行tomcat root用户启动tomcat有一个严重的问题,那就是tomcat具有root权限. 这意味着你的任何一个页面脚本(html/js)都具有root权 ...
- js中的递归总结
主要从"变量+函数"和"函数+变量"两个方面说明解释. function fun() { // 自己调用自己,称为递归调用 fun(); console.log ...
- 简单的sql调优(批处理)
最近在写一个java的爬虫程序时,遇到了一个大量数据进行插入更新和大量数据循环查询的问题,所以查了一下一般的调优的方式,下面主要介绍我采取的调优措施. 一 .调优思路 先说说我采取方式的调优的思路,这 ...
- 前端页面间传值之cookie传值和url传值
大家好,我是小C: 我们在做一些网站需要传值交互,最近我就遇到了这问题,如果用H5的本地存储,IE8以下是不能支持的,但是官方说到IE8及以上就支持,但是某些版本还是存在问题.所以我们来看看下面两种方 ...
- bzoj 4547 小奇的集合
Description 有一个大小为n的可重集S,小奇每次操作可以加入一个数a+b(a,b均属于S),求k次操作后它可获得的S的和的最大 值.(数据保证这个值为非负数) Input 第一行有两个整数n ...
- [HEOI2016]排序
题目描述 在2016年,佳媛姐姐喜欢上了数字序列.因而他经常研究关于序列的一些奇奇怪怪的问题,现在他在研究一个难题,需要你来帮助他.这个难题是这样子 的:给出一个1到n的全排列,现在对这个全排列序列进 ...
- UVA 12161 Ironman Race in Treeland
题目大意: 每一条边都有两个权值,val和路径长度d,要保证在val<=m 的条件下,求最长的d. 解题报告: 一开始想错了,后来发现还不如直接暴力点分,思想很套路.. 平时我们统计时,都会用合 ...
- [bzoj4405][wc2016]挑战NPC
来自FallDream的博客,未经允许,请勿转载,谢谢. 小N最近在研究NP完全问题,小O看小N研究得热火朝天,便给他出了一道这样的题目: 有n个球,用整数1到n编号.还有m个筐子,用整数1到m编号. ...
- bzoj3126[Usaco2013 Open]Photo 单调队列优化dp
3126: [Usaco2013 Open]Photo Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 374 Solved: 188[Submit] ...