MapReduce 踩坑 - hadoop No FileSystem for scheme: file/hdfs

一、场景

hadoop-3.0.2 + hbase-2.0.0

一个mapreduce任务，在IDEA下本地提交到hadoop集群可以正常运行。

现在需要将IDEA本地项目通过maven打成jar包，从而能够在windows/Linux命令行下，通过Java -jar方式运行。

二、状况

报错可能1：Exception in thread "main" java.io.IOException: No FileSystem for scheme: file

报错可能2：Exception in thread "main" java.io.IOException: No FileSystem for scheme: hdfs

三、分析

主要是maven的maven-assembly带来的问题。
问题产生原因：
- 　LocalFileSystem 所在的包 hadoop-commons 和 DistributedFileSystem 所在的包 hadoop-hdfs，这两者在他们各自的 META-INFO/services下，都包含了不同但重名的文件叫做 org.apache.hadoop.fs.FileSystem。（这个FileSystem文件中，都列出了实现filesystem需要声明的规范类名。）
- 当使用maven-assembly-plugin时，maven会将所有的jar包都merge为一个jar。因此。所有META-INFO/services/org.apache.hadoop.fs.FileSystem 会相互覆盖，最终只留一个（the last one）。在这里，hadoop-commons 中的 FileSystem 会 overwrite 掉 hadoop-hdfs 中的 FileSystem, 因此 DistributedFileSystem 的声明就会失效！

四、解决方案 - 基于mapreduce

在提交mapreduce之前，显式指定 LocalFileSystem 或/和 DistributedFileSystem 的类，以确保它们的声明生效。

    conf.set("fs.hdfs.impl",

        org.apache.hadoop.hdfs.DistributedFileSystem.class.getName()

    );

    conf.set("fs.file.impl",

        org.apache.hadoop.fs.LocalFileSystem.class.getName()

    );

五、解决方案 - 基于 maven-assembly

在pom.xml中，使用如下的maven-assembly。使用merge了所有FileSystem的合并版本，而不是互相overwrite的。

<plugin>

  <groupId>org.apache.maven.plugins</groupId>

  <artifactId>maven-shade-plugin</artifactId>

  <version>2.3</version>

  <executions>

    <execution>

      <phase>package</phase>

      <goals>

        <goal>shade</goal>

      </goals>

      <configuration>

        <transformers>

          <transformer implementation="org.apache.maven.plugins.shade.resource.ServicesResourceTransformer"/>

        </transformers>

      </configuration>

    </execution>

  </executions>

</plugin>

六、参考

https://stackoverflow.com/questions/17265002/hadoop-no-filesystem-for-scheme-file

MapReduce 踩坑 - hadoop No FileSystem for scheme: file/hdfs的更多相关文章

Spark No FileSystem for scheme file 解决方法
在给代码带包成jar后,放到环境中运行出现如下错误: Exception in thread "main" java.io.IOException: No FileSystem f ...
hadoop No FileSystem for scheme: hdfs
http://stackoverflow.com/questions/17265002/hadoop-no-filesystem-for-scheme-file This is a typical c ...
No FileSystem for scheme: 远程访问HDFS找不到shceme
问题描述: hadoop版本:hadoop-2.0.0-cdh4.3.0 在本地环境下能够找到scheme,但是通过maven打包fatjar 后放到其他机器上就出现找不到scheme. 看了代码,发 ...
hadoop之mapReduce踩坑集合
居然没有把这个目录,之前还想爆粗口的,还是算了. 上苷酸菜: 1.对于mapreduce中FileInputFormat只输入input文件根目录的方法尝试. 很简单好吧: step1: FileIn ...
Hadoop EC 踩坑：data block 缺失导致的 HDFS 传输速率下降
环境:hadoop-3.0.2 + 11 机集群 + RS-6-3-1024K 的EC策略状况:某天,往 HDFS 上日常 put 业务数据时,发现传输速率严重下降分析: 检查集群发现,在之前的传 ...
MapReduce 踩坑：Aggregation is not enabled. Try the nodemanager at IP:HOST
原因:yarn-site.xml 中,有关mapreduce日志查看的aggregation未配置启用解决:在yarn-site.xml 中加入以下配置 <property> <n ...
Eclipse maven hadoop -- java.io.IOException: No FileSystem for scheme: hdfs
2019-01-10 概述今天在Windows系统下新安装了Eclipse和maven的环境,想利用Maven构建一个Hadoop程序的,结果却发现程序运行时一直报 “No FileSystem f ...
Hadoop编程踩坑
Hadoop踩坑在hadoop所有组件编程中,遇到在Windows下运行程序出现 java.io.IOException: Could not locate executable null\bin\ ...
Hadoop 3.1.2报错：xception in thread "main" org.apache.hadoop.fs.UnsupportedFileSystemException: No FileSystem for scheme "hdfs"
报错内容如下: Exception in thread "main" org.apache.hadoop.fs.UnsupportedFileSystemException: No ...

随机推荐

oracle的高级查询
1.简单连接基本连接语法:SELECT [ALL|DISTINCT]column_name[,expression…]FROM table1_name[,table2_name,view_name, ...
洛谷试炼场 - 关卡2-1 - 简单的模拟 - (Done)
最近这段时间感冒外加一些乱七八糟的事情,导致脑子严重僵化……只好刷刷基础(水)题巩固巩固基础(混混题数). 目录 P1003 铺地毯 P1067 多项式输出 P1540 机器翻译 P1056 排座椅 ...
转 docker创建私有仓库和k8s中使用私有镜像
docker私有仓库建立环境说明我们选取192.168.5.2做私有仓库地址yum install docker -y1.启动docker仓库端口服务 docker run -d -p 5000:5 ...
c语言实现wc功能
本随笔对网站http://blog.chinaunix.net/uid-22566367-id-381958.html有所借鉴 #include <stdio.h> #define BEG ...
深入浅出Vue基于“依赖收集”的响应式原理（转）
add by zhj: 文章写的很通俗易懂,明白了Object.defineProperty的用法原文:https://zhuanlan.zhihu.com/p/29318017 每当问到VueJS ...
ts-loader 安装问题
首先,有个问题:ts-loader是将typescript转成javascript,转成哪个版本的javascript版本? 查询到参考地址:http://morning.work/page/othe ...
Ch03 数组相关操作 - 练习
1. 编写一段代码,将a设置为一个n个随机数的数组,要求随机数介于0(包含)和n(不包含)之间. //import java.lang.Math def getArray(n:Int)={ val ...
RabbitMQ:Docker环境下搭建rabbitmq集群
RabbitMQ作为专业级消息队列:如何在微服务框架下搭建使用组件文档: https://github.com/bijukunjummen/docker-rabbitmq-cluster 下载镜像 ...
Cocos Creator Slider（进度条）的三种实现
实现原理: 方法一:动态计算,slider上增加背景图,根据滑动的进度动态计算背景图的大小:方法二:slider+progress,根据slider滑动的进度,动态改变progress的显示进度:方法 ...
Ubuntu16.04彻底卸载MySQL
删除mysql的数据文件 sudo rm /var/lib/mysql/ -R 删除mysql的配置文件 sudo rm /etc/mysql/ -R 自动卸载mysql(包括server和clien ...

MapReduce 踩坑 - hadoop No FileSystem for scheme: file/hdfs

MapReduce 踩坑 - hadoop No FileSystem for scheme: file/hdfs的更多相关文章

随机推荐

热门专题