启动haoop并运行wordcount
启动hadoop,这里hadoop的版本是2.7.4
进入Hadoop的安装目录的bin目录下,采用-format命令格式化文件系统。
hadoop namenode -format
hadoop datanode -format
start-all.sh
注意:在执行格式化-format命令时,要避免NameNode的namespace ID与DataNode的namespace ID
的不一致。这是因为每格式化就会产生Name、Data、temp等临时文件记录信息,多次格式化就会产生很多的Name、Data、temp,这样容易导致ID的不同,使Hadoop不能正常运行。每次执行格式化命令是,就需要将DataNode和NameNode上原来的data、temp文件删除。
启动Hadoop,采用start-all.sh命令:start-all.sh
查看进程,采用jps命令:jps
使用了废弃的命令
DEPRECATED: Use of this script to execute hdfs command is deprecated.
Instead use the hdfs command for it.
$ hadoop dfs -ls
DEPRECATED: Use ofthis script. to execute hdfs command is deprecated.
Instead use the hdfscommand for it.
原来从0.21.0版本以后,hadoop 命令换成了hdfs命令,上面的命令如同下面的命令:
$ hdfs dfs -ls // 这时就没有错误了
This script is Deprecated. Instead use stop-dfs.sh and stop-yarn.sh
This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh
主从时间不对
Got exception: org.apache.hadoop.yarn.exceptions.YarnException: Unauthorized request to start container.
This token is expired. current time is 1508407745227 found 1508379544313
Note: System times on machines may be out of sync. Check system time and time zones.
调整一下master和slave的时间,使其一致吧
hostname和/etc/hosts的配置错误
Got exception: java.net.ConnectException: Call From hadoop.master/192.168.168.11 to hadoop.master:41190 failed on connection exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused
老子,尼玛,沃日啊,
下图给出了解释,自己看

#!/bin/bash # 下面对hdfs的操作都在绝对路径下 # 在HDFS中创建input文件目录
hdfs dfs -rm /input/* # 删除结果文件
hdfs dfs -rm /output/*
hdfs dfs -rmdir /output # 上传文件到/input目录
hdfs dfs -put /root/test.txt /input hadoop jar /usr/local/hadoop-2.7.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.4.jar wordcount /input /output hdfs dfs -ls /output
# 查看输出结果的目录
# 查看输出结果
hdfs dfs -cat /output/part-r-00000
查看集群状态:
hdfs dfsadmin -report
启动haoop并运行wordcount的更多相关文章
- hadoop2.6.4运行wordcount
hadoop用户登录,启动服务: start-dfs.sh && start-yarn.sh 创建输入目录: hadoop df -mkdir /input 把测试文件导入/input ...
- CentOS上安装Hadoop2.7,添加数据节点,运行wordcount
安装hadoop的步骤比较繁琐,但是并不难. 在CentOS上安装Hadoop2.7 1. 安装 CentOS,注:图形界面并无必要 2. 在CentOS里设置静态IP,手工编辑如下4个文件 /etc ...
- debian下 Hadoop 1.0.4 集群配置及运行WordCount
说明:我用的是压缩包安装,不是安装包 官网安装说明:http://hadoop.apache.org/docs/r1.1.2/cluster_setup.html,繁冗,看的眼花...大部分人应该都不 ...
- (三)配置Hadoop1.2.1+eclipse(Juno版)开发环境,并运行WordCount程序
配置Hadoop1.2.1+eclipse(Juno版)开发环境,并运行WordCount程序 一. 需求部分 在ubuntu上用Eclipse IDE进行hadoop相关的开发,需要在Eclip ...
- win10+eclipse+hadoop2.7.2+maven+local模式直接通过Run as Java Application运行wordcount
一.准备工作 (1)Hadoop2.7.2 在linux部署完毕,成功启动dfs和yarn,通过jps查看,进程都存在 (2)安装maven 二.最终效果 在windows系统中,直接通过Run as ...
- Spark on YARN简介与运行wordcount(master、slave1和slave2)(博主推荐)
前期博客 Spark on YARN模式的安装(spark-1.6.1-bin-hadoop2.6.tgz +hadoop-2.6.0.tar.gz)(master.slave1和slave2)(博主 ...
- Spark standalone简介与运行wordcount(master、slave1和slave2)
前期博客 Spark standalone模式的安装(spark-1.6.1-bin-hadoop2.6.tgz)(master.slave1和slave2) Spark运行模式概述 1. Stan ...
- 021_在Eclipse Indigo中安装插件hadoop-eclipse-plugin-1.2.1.jar,直接运行wordcount程序
1.工具介绍 Eclipse Idigo.JDK1.7-32bit.hadoop1.2.1.hadoop-eclipse-plugin-1.2.1.jar(自己网上下载) 2.插件安装步骤 1)将ha ...
- RedHat 安装Hadoop并运行wordcount例子
1.安装 Red Hat 环境 2.安装JDK 3.下载hadoop2.8.0 http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/had ...
随机推荐
- HDUOJ--点球大战
点球大战 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Submi ...
- js控制swf播放
<html> <head> <title>用js代码控制flash的播放</title> <meta charset="utf-8&qu ...
- Python的 numpy中 meshgrid 和 mgrid 的区别和使用
一.meshgrid函数 meshgrid函数通常使用在数据的矢量化上. 它适用于生成网格型数据,可以接受两个一维数组生成两个二维矩阵,对应两个数组中所有的(x,y)对. 示例展示: 由上面的示例展示 ...
- 【js】typeof与instanceof
typeof 运算符 返回一个用来表示表达式的数据类型的字符串. typeof[()expression[]] ; expression 参数是需要查找类型信息的任意表达式. 说明 typeof 运算 ...
- 搭建Go调试环境(LiteIDE)
安装及配置LiteIDE 将 liteidex32.1.windows-qt5.zip解压到D:\即完成安装. 设置编辑环境 查看->编辑当前环境,确认GOROOT变 ...
- RHCE7 管理II-5管理进程的优先级
进程的优先级值称为进程的nice值,共有40种不同的取值(用数字-20到19表示) nice值越大,表示进程的优先级越低. 进程的nice值,只允许root用户来设置负的nice:其他用户只允许设置正 ...
- Form_通过FND_FNDFLUPL标准功能上传CSV控件(案例)
2014-06-08 Created By BaoXinjian
- OGG_GoldenGate数据控制进程Manager(案例)
2014-03-03 Created By BaoXinjian
- python 实现一个双色球生成程序
最近学习Python的Random函数,就顺手写一个随机数的双色球程序,开发环境:python2.7 , 附上源代码如下: # _*_ coding:utf- _*_ import random qi ...
- 【转载】BasicDataSource配置说明
commons DBCP 配置参数简要说明 在配置时,主要难以理解的主要有:removeAbandoned .logAbandoned.removeAbandonedTimeout.maxWait这四 ...