6、Hadoop 2.6.0 运行

运行方式

Local (Standalone) Mode
Pseudo-Distributed Mode
Fully-Distributed Mode

Standalone Operation

  $ sudo mkdir input

  $ sudo cp etc/hadoop/*.xml input

  $ sudo bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar grep input output 'dfs[a-z.]+'

  $ cat output/*

Pseudo-Distributed Operation

Configuration

Use the following:

etc/hadoop/core-site.xml:

<configuration>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://hw-TM1612:8020</value>

    </property>

</configuration>

<configuration>

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/opt/hadoop-2.6.0-cdh5.5.0/data/tmp</value>

    </property>

</configuration>

etc/hadoop/hdfs-site.xml:

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

</configuration>

sudo bin/hdfs namenode -format  ##格式化namenode

sudo sbin/hadoop-daemon.sh start namenode   ##启动namenode

sudo sbin/hadoop-daemon.sh start datanode   ##启动datanode

jps

sudo bin/hdfs dfs -mkdir -p /user/hw/   ##创建目录

sudo bin/hdfs dfs -ls -R /  ##循环列出目录 -R

sudo bin/hdfs dfs -mkdir -p /user/hw/mapreduce/wordcount/input  ##创建hdfs文件

sudo bin/hdfs dfs -put wcinput/wc.input /user/hw/mapreduce/wordcount/input    ## 上传文件

sudo bin/hdfs dfs -ls /user/hw/mapreduce/wordcount/input

sudo bin/hdfs dfs -cat /user/hw/mapreduce/wordcount/input/wc.input  ##查看

sudo bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.5.0.jar wordcount /user/hw/mapreduce/wordcount/input/ /user/hw/mapreduce/wordcount/output ##hdfs下运行

sudo bin/hdfs dfs -cat /user/hw/mapreduce/wordcount/output/part-r-00000

默认web端口号：50070

YARN on Single Node

etc/hadoop/mapred-site.xml:

<configuration>

    <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

</configuration>

etc/hadoop/yarn-site.xml:

<configuration>

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

</configuration>

sudo gedit etc/hadoop/yarn-env.sh

sudo gedit etc/hadoop/yarn-site.xml

sudo gedit etc/hadoop/slaves    ##更改主机名

sudo sbin/yarn-daemon.sh start resourcemanager  ##启动resourcemanager

jps

sudo sbin/yarn-daemon.sh start nodemanager  ##启动nodemanager

jps

sudo gedit etc/hadoop/mapred-env.sh

sudo mv etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml

sudo gedit etc/hadoop/mapred-site.xml

sudo bin/hdfs dfs -rm -r /user/hw/mapreduce/wordcount/output

sudo bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.5.0.jar wordcount /user/hw/mapreduce/wordcount/input/ /user/hw/mapreduce/wordcount/output

默认web端口号：8088

启动历史服务器

sudo sbin/mr-jobhistory-daemon.sh start historyserver

6、Hadoop 2.6.0 运行的更多相关文章

基于Hadoop 2.6.0运行数字排序的计算
上个博客写了Hadoop2.6.0的环境部署,下面写一个简单的基于数字排序的小程序,真正实现分布式的计算,原理就是对多个文件中的数字进行排序,每个文件中每个数字占一行,排序原理是按行读取后分块进行排序 ...
Ubuntu14.04用apt在线/离线安装CDH5.1.2[Apache Hadoop 2.3.0]
目录 [TOC] 1.CDH介绍 1.1.什么是CDH和CM? CDH一个对Apache Hadoop的集成环境的封装,可以使用Cloudera Manager进行自动化安装. Cloudera-Ma ...
eclipse/intellij idea 远程调试hadoop 2.6.0
很多hadoop初学者估计都我一样,由于没有足够的机器资源,只能在虚拟机里弄一个linux安装hadoop的伪分布,然后在host机上win7里使用eclipse或Intellj idea来写代码测试 ...
基于Hadoop 2.2.0的高可用性集群搭建步骤（64位）
内容概要: CentSO_64bit集群搭建, hadoop2.2(64位)编译,安装,配置以及测试步骤新版亮点: 基于yarn计算框架和高可用性DFS的第一个稳定版本. 注1:官网只提供32位re ...
CentOS 64位上编译 Hadoop 2.6.0
Hadoop不提供64位编译好的版本号,仅仅能用源代码自行编译64位版本号. 学习一项技术从安装開始.学习hadoop要从编译開始. 1.操作系统编译环境 yum install cmake lzo- ...
Hadoop 2.6.0分布式部署參考手冊
Hadoop 2.6.0分布式部署參考手冊关于本參考手冊的word文档.能够到例如以下地址下载:http://download.csdn.net/detail/u012875880/8291493 ...
hadoop 2.2.0集群安装
相关阅读: hbase 0.98.1集群安装本文将基于hadoop 2.2.0解说其在linux集群上的安装方法,并对一些重要的设置项进行解释,本文原文链接:http://blog.csdn.net ...
hadoop 2.2.0 关于map和reduce的个数的设置
关于hadoop中的map过程,我的理解是每一个map系统会开启一个JVM进程来处理,map之间相互并行,map函数内串行.这样的想法是否正确? 由于想在hadoop集群上算一个初始输入数据不多,但是 ...
菜鸟玩云计算之十八：Hadoop 2.5.0 HA 集群安装第1章
菜鸟玩云计算之十八:Hadoop 2.5.0 HA 集群安装第1章 cheungmine, 2014-10-25 0 引言在生产环境上安装Hadoop高可用集群一直是一个需要极度耐心和体力的细致工作 ...

随机推荐

RestTemplate相关组件：ClientHttpRequestInterceptor【享学Spring MVC】
每篇一句做事的人和做梦的人最大的区别就是行动力前言本文为深入了解Spring提供的Rest调用客户端RestTemplate开山,对它相关的一些组件做讲解. Tips:请注意区分RestTemp ...
golang中，map作为函数参数是如何传递的
当你声明一个map的时候: m := make(map[int]int) 编译器会调用 runtime.makemap: // makemap implements a Go map creation ...
CLRS10.1-6练习 - 用双栈实现队列
双栈实现队列算法: 分别考虑队列两种操作入队和出队,我们假设使用栈s1 s2, s1用来模拟入队,s2用来模拟出队入队: 入队操作直接执行s1.push即可出队: 代码实现 package hel ...
LOJ#2409. 「THUPC 2017」小 L 的计算题 / Sum（生成函数）
题意给定一个长为 \(n\) 的序列 \(\{a_i\}\) 对于 \(k \in [1, n]\) 求 \[ f_k = \sum_{i = 1}^{n} a_i^k \pmod {9982443 ...
mapreduce课堂测试结果
package mapreduce; import java.io.IOException; import java.util.StringTokenizer; import org.apache.h ...
nginx.conf配置demo
#user nobody; worker_processes 4; #error_log logs/error.log; #error_log logs/error.log notice; #erro ...
Tomcat组件梳理--Catalina
Tomcat组件梳理--Catalina 1.定义和功能 Catalina是Tomcat的核心组件,是Servlet容器,Catalina包含了所有的容器组件,其他模块均为Catalina提供支撑.通 ...
洛谷【P1048 采药】题解
题目链接分析:典型的01背包问题,设dp[i][j]为空间(也就是题面中的时间)是j的背包在装前i个物品(草药)所得的最大价值,v[i]为第i个物品的重量(采药的时间),w[i]为第i个物品(草药) ...
PHP基于TP5使用Websocket框架之GatewayWorker开发电商平台买家与卖家实时通讯
前段时间公司提了一个新的需求,在商品的详情页要实现站内买家和商品卖家实时通讯的功能以方便沟通促成交易,要开发此功能当时首先考虑到的就是swoole和workerman了,从网上大概了解了一下关于这两款 ...
react学习记录（三）——状态、属性、生命周期
react的状态state React 里,只需更新组件的 state,然后根据新的 state 重新渲染用户界面(不要操作 DOM) class Clock extends React.Compon ...

6、Hadoop 2.6.0 运行

运行方式

Standalone Operation

Pseudo-Distributed Operation

YARN on Single Node

启动历史服务器

6、Hadoop 2.6.0 运行的更多相关文章

随机推荐

热门专题