HDFS追加文件

配置：hdfs-site.xml

<property>

	    <name>dfs.support.append</name>

	    <value>true</value>

</property>

追加一个文件

package com.wyp;

	import org.apache.hadoop.conf.Configuration;

	import org.apache.hadoop.fs.FileSystem;

	import org.apache.hadoop.fs.Path;

	import org.apache.hadoop.io.IOUtils;

	import java.io.*;

	import java.net.URI;

	/**

	 * blog: http://www.iteblog.com/

	 * Date: 14-1-2

	 * Time: 下午6:09

	 */

	public class AppendContent {

	    public static void main(String[] args) {

	        String hdfs_path = "hdfs://mycluster/home/wyp/wyp.txt";//文件路径

	        Configuration conf = new Configuration();

	        conf.setBoolean("dfs.support.append", true);

	        String inpath = "/home/wyp/append.txt";

	        FileSystem fs = null;

	        try {

	            fs = FileSystem.get(URI.create(hdfs_path), conf);

	            //要追加的文件流，inpath为文件

	            InputStream in = new

	                  BufferedInputStream(new FileInputStream(inpath));

	            OutputStream out = fs.append(new Path(hdfs_path));

	            IOUtils.copyBytes(in, out, 4096, true);

	        } catch (IOException e) {

	            e.printStackTrace();

	        }

	    }

	}

追加一行内容

/**

     * 以append方式将内容添加到HDFS上文件的末尾;注意：文件更新，需要在hdfs-site.xml中添<property><name>dfs.

     * append.support</name><value>true</value></property>

     */

    private static void appendToHdfs() throws FileNotFoundException,

            IOException {

        String dst = "hdfs://192.168.1.11:9000/usr/yujing/test.txt";

        Configuration conf = new Configuration();

        FileSystem fs = FileSystem.get(URI.create(dst), conf);

        FSDataOutputStream out = fs.append(new Path(dst));  

        int readLen = "zhangzk add by hdfs java api".getBytes().length;  

        while (-1 != readLen) {

            out.write("zhangzk add by hdfs java api".getBytes(), 0, readLen);

        }

        out.close();

        fs.close();

    }

HDFS追加文件的更多相关文章

HDFS 中文件操作的错误集锦
问题1 Java ApI执行追加写入时:无法写入问题描述: ①当前数据节点无法写入,②追加文件需要再次请求. 问题2 命令行执行追加写入时:无法写入问题描述: 当前数据节点无法写入问题3 ...
使用oracle的大数据工具ODCH访问HDFS数据文件
软件下载 Oracle Big Data Connectors:ODCH 下载地址: http://www.oracle.com/technetwork/bdc/big-data-connectors ...
Java追加文件内容的三种方法
import java.io.BufferedWriter; import java.io.File; import java.io.FileOutputStream; import java.io. ...
（转）distcp从ftp到hdfs拷贝文件
link :http://blog.csdn.net/sptoor/article/details/11523469 distcp从ftp到hdfs拷贝文件: hadoop distcp ftp:// ...
Spark中加载本地（或者hdfs）文件以及SparkContext实例的textFile使用
默认是从hdfs读取文件,也可以指定sc.textFile("路径").在路径前面加上hdfs://表示从hdfs文件系统上读本地文件读取 sc.textFile("路 ...
java追加文件的几种方式
import java.io.BufferedWriter; import java.io.FileOutputStream; import java.io.FileWriter; import ja ...
HDFS的Java客户端操作代码(HDFS删除文件或目录)
1.HDFS删除文件或目录 package Hdfs; import java.io.IOException; import java.net.URI; import org.apache.hadoo ...
Hadoop HDFS分布式文件系统设计要点与架构
Hadoop HDFS分布式文件系统设计要点与架构 Hadoop简介:一个分布式系统基础架构,由Apache基金会开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群 ...
hadoop 提高hdfs删文件效率----hadoop删除文件流程解析
前言这段时间在用hdfs,由于要处理的文件比较多,要及时产出旧文件,但是发现hdfs的blocks数一直在上涨,经分析是hdfs写入的速度较快,而block回收较慢,所以分心了一下hadoop删文件 ...

随机推荐

mysql高可用研究(一) 主从+MHA架构
最近在研究mysql的高可用架构,自己想总结下常用的高可用方案都有哪些.有哪些优缺点以及应用的场景?搞得是头昏脑涨,天昏地暗,看了诸多资料,每次都觉得公说公有理婆说婆有理.其实嘛,大家说的都有一定的道 ...
Docker 镜像篇
镜像是 Docker 容器的基石,容器是镜像的运行实例,有了镜像才能启动容器. docker两个跟镜像有关的命令: hello-world - 最小的镜像 hello-world 是 Docker 官 ...
剑指offer之二叉搜索树的后续遍历序列
题目描述: 输入一个整数数组,判断该数组是不是某二叉搜索树的后序遍历的结果.如果是则输出Yes,否则输出No.假设输入的数组的任意两个数字都互不相同. public class Solution { ...
Delphi UniDAC 通过http协议连接数据库的设置
Connection through HTTP tunnel(using http protocol) Sometimes client machines are shielded by a fire ...
LightOJ 1138 二分
1138 - Trailing Zeroes (III) PDF (English) Statistics Forum Time Limit: 2 second(s) Memory Limit: ...
php之定义大字符串数据时使用定界符来标识
在定义大字符串数据时,通常使用定界符来标识,这种方式能保留文本中的格式,如文本中的换行.定界符使用格式如下. <<<identifier 格式化文本 identifier 其中,符号 ...
Codeforces 486D Valid Sets：Tree dp【n遍O(n)的dp】
题目链接:http://codeforces.com/problemset/problem/486/D 题意: 给你一棵树,n个节点,每个节点的点权为a[i]. 问你有多少个连通子图,使得子图中的ma ...
内存表 ClientDataSet CreateDataSet
unit Form_Main; interface uses Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, F ...
列存储压缩技巧，除公共除数或者同时减去最小数，字符串压缩的话，直接去重后用数字ID压缩
Column-store compression At a high level, doc values are essentially a serialized column-store. As w ...
GitHub基本使用
什么是GitHub? GitHub是用于版本控制和协作的代码托管平台.它可以让您和其他人在任何地方一起工作本教程教你如GitHub必需资源,如仓库,分支,提交和拉请求.您将创建自己的Hello Wo ...

HDFS追加文件

HDFS追加文件的更多相关文章

随机推荐

热门专题