windows环境下编写hadoop程序

新建：File->new->Project->Maven->next

GroupId 和ArtifactId 随便写（还是建议规范点）->finfsh

会生成pom.xml，文件内容如下

<?xml version="1.0" encoding="UTF-8"?>

<project xmlns="http://maven.apache.org/POM/4.0.0"

         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">

    <modelVersion>4.0.0</modelVersion>

    <groupId>com.hadoopbook</groupId>

    <artifactId>hadoop-demo</artifactId>

    <packaging>jar</packaging>

    <dependencies>

        <dependency>

            <groupId>commons-beanutils</groupId>

            <artifactId>commons-beanutils</artifactId>

            <version>1.9.3</version>

        </dependency>

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-common</artifactId>

            <version>2.7.0</version>

        </dependency>

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-hdfs</artifactId>

            <version>2.7.0</version>

        </dependency>

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-mapreduce-client-common</artifactId>

            <version>2.7.0</version>

        </dependency>

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-mapreduce-client-core</artifactId>

            <version>2.7.0</version>

        </dependency>

        <dependency>

            <groupId>junit</groupId>

            <artifactId>junit</artifactId>

            <version>3.8.1</version>

            <scope>test</scope>

        </dependency>

    </dependencies>

</project>

可以网上找个wordCount（单词计数）源码进行测试，复制进去会发现以下的那些包都是报红，因为许多类都是无法识别的。

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

接下来打开File->project Structure->Modules->右侧+->JARs or directories

将你hadoop集群里面下载的jar包全部导入进去

点击左侧Arifacts ->+->JAR->empty

点击output layout下方的+，选择module output，然后勾选我们的项目，点击确定,这时报错的信息就没有了

idea打包成jar

File->project Structure->点击左侧Arifacts->+->JAR->From modules with dependenciestu,Build on make打上勾

MAain.class为程序的主方法，相当于程序的入口

JAR files from libraries选第二个，选定输出路径->ok

Build->Build Arifacts->项目的jar->build->到输出路径查看即可。

上传jar包到hadoop集群并运行

利用远程工具将生成的.jar上传到hadoop主节点的目录下（/app/hadoop/hadoop-2.2.0）目录根据自己的情况而定
创建input目录

hadoop fs -mkdir -p /usr/hadoop/input

复制本地文件到hdfs文件系统

hadoop fs -put test.txt /usr/hadoop/input

现在.jar有了，输入文件有了，执行.jar。切记不要自己手动提前新建输出文件

 hadoop jar hadoop_demo_jar/hadoop-demo.jar workCount /usr/hadoop/input /usr/hadoop/output

执行成功

查看输出结果

hadoop fs -cat /usr/hadoop/output/*

HDFS常用命令可以参考这篇博客写得不错：https://blog.csdn.net/sunshingheavy/article/details/53227581

编写hadoop程序，并打包jar到hadoop集群运行的更多相关文章

flink idea 打包jar 并放到集群上运行
flink idea 打包jar 并放到集群上运行在开始之前注意前提,当前项目的scala的版本要和集群上的scala一致我已经创建好一个wordCount的flink项目注意项目的po ...
MR程序本地调试，提交到集群运行
在本地调试,提交到集群上运行. 在本地程序中的Configuration中添加如下配置: Configuration conf = new Configuration(); conf.set(&quo ...
编写hadoop程序并打成jar包上传到hadoop集群运行
准备工作: 1. hadoop集群(我用的是hadoop-2.7.3版本),这里hadoop有两种:1是编译好的hadoop-2.7.3:2是源代码hadoop-2.7.3-src: 2. 自己的机器 ...
Hadoop集群运行JNI程序
要在Hadoop集群运行上运行JNI程序,首先要在单机上调试程序直到可以正确运行JNI程序,之后移植到Hadoop集群就是水到渠成的事情. Hadoop运行程序的方式是通过jar包,所以我们需要将所有 ...
编写Spark的WordCount程序并提交到集群运行[含scala和java两个版本]
编写Spark的WordCount程序并提交到集群运行[含scala和java两个版本] 1. 开发环境 Jdk 1.7.0_72 Maven 3.2.1 Scala 2.10.6 Spark 1.6 ...
hadoop本地运行与集群运行
开发环境: windows10+伪分布式(虚拟机组成的集群)+IDEA(不需要装插件) 介绍: 本地开发,本地debug,不需要启动集群,不需要在集群启动hdfs yarn 需要准备什么: 1/配置w ...
Spark学习笔记3（IDEA编写scala代码并打包上传集群运行）
Spark学习笔记3 IDEA编写scala代码并打包上传集群运行我们在IDEA上的maven项目已经搭建完成了,现在可以写一个简单的spark代码并且打成jar包上传至集群,来检验一下我们的sp ...
简单说明hadoop集群运行三种模式和配置文件
Hadoop的运行模式分为3种:本地运行模式,伪分布运行模式,集群运行模式,相应概念如下: 1.独立模式即本地运行模式(standalone或local mode)无需运行任何守护进程(daemon) ...
吴裕雄--天生自然HADOOP操作实验学习笔记：安装zookeeper集群
实验目的了解zookeeper的概念和原理学会安装zookeeper集群并验证掌握zookeeper命令使用实验原理 1.Zookeeper介绍 ZooKeeper是一个分布式的,开放源码的分 ...
hadoop一代集群运行代码案例
hadoop一代集群运行代码案例集群一个 master,两个slave,IP分别是192.168.1.2.192.168.1.3.192.168.1.4 hadoop版 ...

随机推荐

UOJ#419. 【集训队作业2018】圆形（格林公式）
题面传送门题解首先您得会用格林公式计算圆的面积并这里只需要动态维护一下圆弧就可以了时间复杂度\(O(n^2\log n)\) //minamoto #include<bits/stdc ...
Oracle11g手动创建数据库方法
Oracle11g手动创建数据库方法参考网页http://www.th7.cn/db/Oracle/201311/36926.shtml 安装路径我的安装路径是:E:\app\admin\prod ...
【ElasticSearch】：Mapping相关
Mapping 类似数据库中的表结构定义,主要作用如下: 定义Index下的字段名(Field Name). 定义字段类型,例如数值型.字符串型.布尔型等. 定义倒排索引相关配置,比如是否索引.记录p ...
java命令--jstack 工具查看JVM堆栈信息
介绍 jstack是java虚拟机自带的一种堆栈跟踪工具.jstack用于打印出给定的java进程ID或core file或远程调试服务的Java堆栈信息,如果是在64位机器上,需要指定选项" ...
Python之tkinter中的askyescancel窗口返回值
if messagebox.askokcancel(title="确认取消",message="您确认注册该账号吗?"): messagebox.showinf ...
MySQL 5.5主从复制（Replication）
简介 MySQL的主从复制(Replication),可以保持两台MySQL数据库的内容一致.因为其同步过程是异步的,所以备份数据库上做任何操作,都不会影响主数据库的性能.对游戏后台数据库而言,这是一 ...
ThreadLocal管理Connection
ThreadLocal管理Connection 每一个用户都对应有一个单独线程,每一个线程都有一个数据库连接对象Connection对象接待它. 一个用户对应一个线程,这个线程中的Connection ...
Nginx单向认证的安装配置
Nginx单向认证的安装配置首先系统要已经安装了openssl,以下是使用openssl安装配置单向认证的执行步骤与脚本: #------------------------------------ ...
全网最详细的Windows系统里Oracle 11g R2 Database（64bit）的完全卸载（图文详解）
不多说,直接上干货! 前期博客全网最详细的Windows系统里Oracle 11g R2 Database(64bit)的下载与安装(图文详解) 若你不想用了,则可安全卸载. 完全卸载Oracle ...
26-hadoop-hbase简介
hadoop的生态系统 1, hbase简介 –HBase–HadoopDatabase,是一个高可靠性.高性能.面向列.可伸缩.实时读写的分布式数据库 –利用HadoopHDFS作为其文件存储系统, ...

编写hadoop程序，并打包jar到hadoop集群运行

windows环境下编写hadoop程序

idea打包成jar

上传jar包到hadoop集群并运行

编写hadoop程序，并打包jar到hadoop集群运行的更多相关文章

随机推荐

热门专题