Hadoop-mapreduce 程序在windows上执行需要注意的问题

1.在主程序中需要添加这几个参数配置

Configuration conf = new Configuration();

        // 1、设置job运行时要访问的默认文件系统

        conf.set("fs.defaultFS", HADOOP_ROOT_PATH);

        // 2、设置job提交到哪去运行

        conf.set("yarn.resourcemanager.hostname", "hadoop1");

        conf.set("mapreduce.framework.name", "yarn");

        // 3、如果要从windows系统上运行这个job提交客户端程序，则需要加这个跨平台提交的参数

        conf.set("mapreduce.app-submission.cross-platform", "true");

        Job job = Job.getInstance(conf);

        // 1、封装参数：jar包所在的位置

        job.setJar("D:\\HadoopStudy\\Workspace\\hdfs24\\hdfs24_fat.jar");

        //job.setJarByClass(WordCountMain.class);

        // 2、封装参数： 本次job所要调用的Mapper实现类、Reducer实现类

        job.setMapperClass(WordCountMapper.class);

        job.setReducerClass(WordcountReducer.class);

        // 3、封装参数：本次job的Mapper实现类、Reducer实现类产生的结果数据的key、value类型

        job.setMapOutputKeyClass(Text.class);

        job.setMapOutputValueClass(IntWritable.class);

        job.setOutputKeyClass(Text.class);

        job.setOutputValueClass(IntWritable.class);

        // 4、封装参数：本次job要处理的输入数据集所在路径、最终结果的输出路径

        Path output = new Path(HADOOP_OUTPUT_PATH);

        FileSystem fs = FileSystem.get(new URI(HADOOP_ROOT_PATH), conf);

        if (fs.exists(output)) {

            fs.delete(output, true);

        }

        FileInputFormat.setInputPaths(job, new Path(HADOOP_INPUT_PATH));

        FileOutputFormat.setOutputPath(job, output); // 注意：输出路径必须不存在

        // 5、封装参数：想要启动的reduce task的数量

        job.setNumReduceTasks(2);

        // 6、提交job给yarn

        boolean res = job.waitForCompletion(true);

        System.out.println("OK");

        System.exit(res ? 0 : -1);

2.需要配置window中的hosts 文件（识别yarn程序配置的主机ip：我在yarn程序中配置的是hadoop1）

修改打 C盘 -> Windows -> System32 -> drives -> etc -> hosts文件

在最下面增加一行

10.1.7.96 hadoop1

如果没有会报以下错误：

Exception in thread "main" java.net.UnknownHostException: Invalid host name: local host is: (unknown); destination host is: "hadoop1":8032; java.net.UnknownHostException; For more details see:  http://wiki.apache.org/hadoop/UnknownHost

    at sun.reflect.GeneratedConstructorAccessor5.newInstance(Unknown Source)

    at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)

    at java.lang.reflect.Constructor.newInstance(Constructor.java:423)

    at org.apache.hadoop.net.NetUtils.wrapWithMessage(NetUtils.java:801)

    at org.apache.hadoop.net.NetUtils.wrapException(NetUtils.java:744)

    at org.apache.hadoop.ipc.Client$Connection.<init>(Client.java:445)

    at org.apache.hadoop.ipc.Client.getConnection(Client.java:1522)

    at org.apache.hadoop.ipc.Client.call(Client.java:1373)

    at org.apache.hadoop.ipc.Client.call(Client.java:1337)

    at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngine.java:227)

    at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngine.java:116)

    at com.sun.proxy.$Proxy13.getNewApplication(Unknown Source)

    at org.apache.hadoop.yarn.api.impl.pb.client.ApplicationClientProtocolPBClientImpl.getNewApplication(ApplicationClientProtocolPBClientImpl.java:217)

    at sun.reflect.GeneratedMethodAccessor3.invoke(Unknown Source)

    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)

    at java.lang.reflect.Method.invoke(Method.java:498)

    at org.apache.hadoop.io.retry.RetryInvocationHandler.invokeMethod(RetryInvocationHandler.java:398)

    at org.apache.hadoop.io.retry.RetryInvocationHandler$Call.invokeMethod(RetryInvocationHandler.java:163)

    at org.apache.hadoop.io.retry.RetryInvocationHandler$Call.invoke(RetryInvocationHandler.java:155)

    at org.apache.hadoop.io.retry.RetryInvocationHandler$Call.invokeOnce(RetryInvocationHandler.java:95)

    at org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:335)

    at com.sun.proxy.$Proxy14.getNewApplication(Unknown Source)

    at org.apache.hadoop.yarn.cl

Hadoop-mapreduce 程序在windows上执行需要注意的问题的更多相关文章

使用Python实现Hadoop MapReduce程序
转自:使用Python实现Hadoop MapReduce程序英文原文:Writing an Hadoop MapReduce Program in Python 根据上面两篇文章,下面是我在自己的 ...
简单的java Hadoop MapReduce程序(计算平均成绩)从打包到提交及运行
[TOC] 简单的java Hadoop MapReduce程序(计算平均成绩)从打包到提交及运行程序源码 import java.io.IOException; import java.util. ...
HDFS基本命令与Hadoop MapReduce程序的执行
一.HDFS基本命令 1.创建目录:-mkdir [jun@master ~]$ hadoop fs -mkdir /test [jun@master ~]$ hadoop fs -mkdir /te ...
[python]使用python实现Hadoop MapReduce程序：计算一组数据的均值和方差
这是参照<机器学习实战>中第15章“大数据与MapReduce”的内容,因为作者写作时hadoop版本和现在的版本相差很大,所以在Hadoop上运行python写的MapReduce程序时 ...
windows 上执行python pywin32.exe
大家熟知的python脚本可以在linux系统上直接运行,因为linux上会安装python编译器然而windows不会安装,如果想要别人直接运行你发布的python脚本,一种方法是在他的windo ...
用Python语言写Hadoop MapReduce程序Writing an Hadoop MapReduce Program in Python
In this tutorial I will describe how to write a simple MapReduce program for Hadoop in the Python pr ...
Python实现Hadoop MapReduce程序
1.概述 Hadoop Streaming提供了一个便于进行MapReduce编程的工具包,使用它可以基于一些可执行命令.脚本语言或其他编程语言来实现Mapper和 Reducer,从而充分利用Had ...
在idea中调试spark程序-配置windows上的 spark local模式
spark程序大致有如下运行模式: standalone模式:spark自带的模式 spark on yarn:利用hadoop yarn来做集群的资源管理 local模式:主要在测试的时候使用, 这 ...
Intellij idea开发Hadoop MapReduce程序
1.首先下载一个Hadoop包,仅Hadoop即可. http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.6.0/hadoop-2.6.0 ...

随机推荐

迅为iMX6开发板支持单核,双核,四核处理器，为客户产品选择提供灵活性
本文转自迅为:http://topeetboard.com 店铺:https://arm-board.taobao.com 处理器:Freescale Cortex-A9 四核 i.MX6Q 主频 1 ...
Android（java）学习笔记192：ContentProvider使用之虚拟短信
1.虚拟短信应用场景: 急着脱身?应付老婆(老公.男女朋友查岗)? 使用虚拟通话短信吧.您只需通过简单设置,软件就会在指定时间会模拟一个“真实”来电或短信来迷惑对方,通过“真实”的证据让对方相 ...
shell脚本的练习
创建一个以.sh结束的文件. 规则: 文件的头部使用#!/bin/sh 开头这个是一个标识的作用,告诉使用哪种脚本来执行 echo 用来向命令行来输出的东西
CREATE GROUP - 定义一个新的用户组
SYNOPSIS CREATE GROUP name [ [ WITH ] option [ ... ] ] where option can be: SYSID gid | USER usernam ...
Lodash数组方法中文总结
LodashAPI总结 Lodash是一个特别特别好用的工具,感觉有了Lodash就没有解决不了的问题了~~~~ 使用初开始官网 https://www.lodashjs.com/docs/4.17 ...
java线程学习2
sleep 变为阻塞态但不释放锁休眠指定毫秒时间 yield 变为就绪态可能立即被执行也可能不立即被执行 join 插队暂停当前执行的线程让调用join的线程先执行线 ...
[PyTorch] rnn,lstm,gru中输入输出维度
本文中的RNN泛指LSTM,GRU等等 CNN中和RNN中batchSize的默认位置是不同的. CNN中:batchsize的位置是position 0. RNN中:batchsize的位置是pos ...
全国绿色计算大赛模拟赛第二阶段 (Python)
第1关气温预测 def dailyTemps(temp_list): result = [] for ca in range(0, len(temp_list)-1): for i in range( ...
LCS以及输出路径模板
记忆两个for用来寻找LCS,DP是二维的,每一维代表了字符串的长度. 寻找的代码部分 if(a[i-1]==b[j-1]) dp[i][j]=dp[i-1][j-1]+1; else dp[i][ ...
LINUX系统---中级相关操作和知识
LINUX系统的中级,来搞一些LINUX安全相关的东西,还有在公司生成中长搞的集群. RHCS集群什么是高可用什么是热备什么是分布式

Hadoop-mapreduce 程序在windows上执行需要注意的问题

Hadoop-mapreduce 程序在windows上执行需要注意的问题的更多相关文章

随机推荐

热门专题