复制本地文件到HDFS本地测试异常

项目中需要将本地文件拷贝到hdfs上，由于本人比较懒，于是使用擅长的Java程序通过Hadoop.FileSystem.CopyFromLocalFile方法来实现。在本地(Window 7 环境)本地模式下运行却遇到了下述异常：

An exception or error caused a run to abort: org.apache.hadoop.io.nativeio.NativeIO$Windows.createFileWithMode0(Ljava/lang/String;JJJI)Ljava/io/FileDescriptor;

java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.createFileWithMode0(Ljava/lang/String;JJJI)Ljava/io/FileDescriptor;

    at org.apache.hadoop.io.nativeio.NativeIO$Windows.createFileWithMode0(Native Method)

    at org.apache.hadoop.io.nativeio.NativeIO$Windows.createFileOutputStreamWithMode(NativeIO.java:559)

    at org.apache.hadoop.fs.RawLocalFileSystem$LocalFSFileOutputStream.<init>(RawLocalFileSystem.java:219)

    at org.apache.hadoop.fs.RawLocalFileSystem$LocalFSFileOutputStream.<init>(RawLocalFileSystem.java:209)

    at org.apache.hadoop.fs.RawLocalFileSystem.createOutputStreamWithMode(RawLocalFileSystem.java:307)

    at org.apache.hadoop.fs.RawLocalFileSystem.create(RawLocalFileSystem.java:295)

    at org.apache.hadoop.fs.RawLocalFileSystem.create(RawLocalFileSystem.java:328)

    at org.apache.hadoop.fs.ChecksumFileSystem$ChecksumFSOutputSummer.<init>(ChecksumFileSystem.java:388)

    at org.apache.hadoop.fs.ChecksumFileSystem.create(ChecksumFileSystem.java:451)

    at org.apache.hadoop.fs.ChecksumFileSystem.create(ChecksumFileSystem.java:430)

    at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:920)

    at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:901)

    at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:798)

    at org.apache.hadoop.fs.FileUtil.copy(FileUtil.java:368)

    at org.apache.hadoop.fs.FileUtil.copy(FileUtil.java:341)

    at org.apache.hadoop.fs.FileUtil.copy(FileUtil.java:292)

    at org.apache.hadoop.fs.LocalFileSystem.copyFromLocalFile(LocalFileSystem.java:82)

    at org.apache.hadoop.fs.FileSystem.copyFromLocalFile(FileSystem.java:1882)

通过分析异常堆栈可知，

org.apache.hadoop.io.nativeio.NativeIO$Windows.createFileWithMode0方法发生了异常，createFileWithMode0方法的实现如下：

    /** Wrapper around CreateFile() with security descriptor on Windows */

    private static native FileDescriptor createFileWithMode0(String path,

        long desiredAccess, long shareMode, long creationDisposition, int mode)

        throws NativeIOException;

通过代码可知，这个方法是hadoop不支持的方法。那么为什么会调用这个方法，通过异常堆栈继续向上追踪，

是在 org.apache.hadoop.fs.RawLocalFileSystem$LocalFSFileOutputStream.<init> 过程调用了nativeio.NativeIO$Windows类，对应的方法如下：

  private LocalFSFileOutputStream(Path f, boolean append,

         FsPermission permission) throws IOException {

       File file = pathToFile(f);

       if (permission == null) {

         this.fos = new FileOutputStream(file, append);

       } else {

         if (Shell.WINDOWS && NativeIO.isAvailable()) {

           this.fos = NativeIO.Windows.createFileOutputStreamWithMode(file,

               append, permission.toShort());

         } else {

           this.fos = new FileOutputStream(file, append);

           boolean success = false;

           try {

             setPermission(f, permission);

             success = true;

           } finally {

             if (!success) {

               IOUtils.cleanup(LOG, this.fos);

             }

           }

         }

       }

     }

通过调用椎栈可知是上述代码第8行调用了NativeIO.Windows类。那么if判断应该是成立的，分析NativeIO.isAvailable方法代码如下：

   /**

    * Return true if the JNI-based native IO extensions are available.

    */

   public static boolean isAvailable() {

     return NativeCodeLoader.isNativeCodeLoaded() && nativeLoaded;

   }

isAvailable方法主要是调用NativeCodeLoader.isNativeCodeLoaded方法

  static {

     // Try to load native hadoop library and set fallback flag appropriately

     if(LOG.isDebugEnabled()) {

       LOG.debug("Trying to load the custom-built native-hadoop library...");

     }

     try {

       System.loadLibrary("hadoop");

       LOG.debug("Loaded the native-hadoop library");

       nativeCodeLoaded = true;

     } catch (Throwable t) {

       // Ignore failure to load

       if(LOG.isDebugEnabled()) {

         LOG.debug("Failed to load native-hadoop with error: " + t);

         LOG.debug("java.library.path=" +

             System.getProperty("java.library.path"));

       }

     }

     if (!nativeCodeLoaded) {

       LOG.warn("Unable to load native-hadoop library for your platform... " +

                "using builtin-java classes where applicable");

     }

   }

   /**

    * Check if native-hadoop code is loaded for this platform.

    *

    * @return <code>true</code> if native-hadoop is loaded,

    *         else <code>false</code>

    */

   public static boolean isNativeCodeLoaded() {

     return nativeCodeLoaded;

   }

通过可以看到，isNativeCodeLoaded方法就是返回一个属性值，那么问题出现在什么地方呢？

经过分析NativeCodeLoaded类的静态构造函数，有一个“System.loadLibrary("hadoop")”方法。是不是这个方法导致的呢？通过在其他同事环境上调试，System.loadLibrary("hadoop") 会异常，从而运行catch部分，但是本人电脑却不会异常，直接继续运行。那么System.loadLibrary方法是什么用途呢，通过分析源码知道，这个方法是加载本地系统和用户的环境变量的。进而分析是因为本人在C:\\Windows\System32目录下有hadoop.dll文件或环境变量Path中配置了%Hadoop_Home%/bin目录而导致的。

简而言之，是因为配置的系统环境变量Path的任意目录下存在hadoop.dll文件，从而被认为这是一个hadoop集群环境，但是hadoop集群又不支持window环境而产生的异常。处理方法也很简单，检查系统环境变量Path下的每一个目录，确保没有hadoop.dll文件即可。

如果是删除系统环境变量Path的某一个目录，需要重启Intellij Idea后ClassLoader类中的usr_paths或sys_paths才会生效。

复制本地文件到HDFS本地测试异常的更多相关文章

5、创建RDD（集合、本地文件、HDFS文件）
一.创建RDD 1.创建RDD 进行Spark核心编程时,首先要做的第一件事,就是创建一个初始的RDD.该RDD中,通常就代表和包含了Spark应用程序的输入源数据.然后在创建了初始的RDD之后,才可 ...
02、创建RDD（集合、本地文件、HDFS文件）
Spark Core提供了三种创建RDD的方式,包括:使用程序中的集合创建RDD:使用本地文件创建RDD:使用HDFS文件创建RDD. 1.并行化集合如果要通过并行化集合来创建RDD,需要针对程序中 ...
上传本地文件到HDFS
源代码: import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hado ...
【HDFS API编程】从本地拷贝文件，从本地拷贝大文件，拷贝HDFS文件到本地
接着之前继续API操作的学习 CopyFromLocalFile: 顾名思义,从本地文件拷贝 /** * 使用Java API操作HDFS文件系统 * 关键点: * 1)create Configur ...
spark读取本地文件
/** * Read a text file from HDFS, a local file system (available on all nodes), or any * Hadoop-supp ...
超实用，你get了吗？再也不怕本地文件更新到环境用Linux命令重启服务器了。。。
来公司这么久,写过不少代码,可是一碰见关于Linux命令操作的马上绕过,每次都是嚷嚷同事过来帮我替换文件,重启服务器,一直害怕接触命令的我一次一次不嫌麻烦,哈哈.有没有醉了?其实我一直都知道操作不难, ...
两种方法上传本地文件到github
https://www.jianshu.com/p/c70ca3a02087 自从使用github以来,一直都是在github网站在线上传文件到仓库中,但是有时因为网络或者电脑的原因上传失败.最重要的 ...
两种方法上传本地文件到github(转)
自从使用github以来,一直都是在github网站在线上传文件到仓库中,但是有时因为网络或者电脑的原因上传失败.最重要的原因是我习惯本地编辑,完成以后再一起上传github.看过了几个教程,总结出最 ...
Git安装及密钥的生成并上传本地文件到GitHub上
之前用的GitHub,不太熟练,一直在上传的过程中遇到了一些问题,看了网上诸多教程,总觉得很乱,特参考一些资料,总结了一篇完整的操作步骤,从下载安装到上传文件,亲测有效 1.下载Git软件:https ...

随机推荐

Log.properties配置详解
一.Log4j简介 Log4j有三个主要的组件:Loggers(记录器),Appenders (输出源)和Layouts(布局).这里可简单理解为日志类别,日志要输出的地方和日志以何种形式输出.综合使 ...
浅尝辄止——使用ActiveX装载WPF控件
1 引言使用VC编写的容器类编辑器,很多都可以挂接ActiveX控件,因为基于COM的ActiveX控件不仅封装性不错,还可以显示一些不错的界面图元. 但是随着技术不断的进步,已被抛弃的Active ...
Vue2父子组件通信探究
父组件: <template> <div id="secondcomponent"> <input type="" v-model ...
细说 webpack 之流程篇
摘自: http://taobaofed.org/blog/2016/09/09/webpack-flow/ 引言目前,几乎所有业务的开发构建都会用到 webpack .的确,作为模块加载和打包神器 ...
Take advantage of “Integrated Calling” to know whom suspect talked to
A new feature in iOS 10 is "Integrated Calling". An integrated call from Chat App like Nav ...
基本变换(读书笔记5 --- Real-Time rendering)
刚体变换即变换不改变了被变换顶点之间的距离,以及偏手性(不会让左右手坐标系颠倒). 下面的平移变换.旋转变换即属于刚体变换平移从一个位置变到另一个位置可以用平移矩阵T来表示,这个矩阵将一个实体变 ...
使用ssh连接远程主机
在linux系统中,ssh是远程登录的默认工具,因为该工具的协议使用了RSA/DSA的加密算法.该工具做linux系统的远程管理是非常安全的. ssh登录远程主机(服务器)一般有两种方式:无密钥方式 ...
Eclipse 4.2 (Juno) 'Cannot create a server using the selected type' in Tomcat 7 - Stack Overflow.html
[太神奇了,真的可以呀] 原文:http://stackoverflow.com/questions/13423593/eclipse-4-2-juno-cannot-create-a-server- ...
mxnet安装
本来不想写这些玩意,但是老是纠缠安装环境,索性自己记一下. 我是在别人的基础上增加的,所以比较全. 裸机开始安装: 1.基本依赖的安装 sudo apt-get update sudo apt-get ...
MySQL分区表管理
RANGE,LIST分区管理 1:为未分区表创建分区 ALTER TABLE trb3 PARTITION BY KEY(id) PARTITIONS 2; 2:删除某个分区的数据 ALTER TAB ...

复制本地文件到HDFS本地测试异常

复制本地文件到HDFS本地测试异常的更多相关文章

随机推荐

热门专题