HDFS 的Trash回收站

1）在core-site.xml文件中添加这个配置

在每个节点(不仅仅是主节点)上添加配置 core-site.xml,增加如下内容

<property>

    <name>fs.trash.interval</name>

    <value></value>

</property>

1440表示在文件放入回收站1440分钟之后才会真得彻底的被删除

2）使用命令行删除文件：

//查看HDFS下的根目录

root@Ubuntu-1:/usr/local/hadoop-2.6.0/bin# hadoop fs -ls /

Found 1 items

drwxr-xr-x   - root supergroup          0 2017-05-19 11:02 /test

//删除文件

root@Ubuntu-1:/usr/local/hadoop-2.6.0/bin# hadoop fs -rm -r /test

17/05/22 15:39:00 INFO fs.TrashPolicyDefault: Namenode trash configuration: Deletion interval = 1440 minutes, Emptier interval = 0 minutes.

Moved: 'hdfs://Ubuntu-1:9000/test' to trash at: hdfs://Ubuntu-1:9000/user/root/.Trash/Current

//查看回收站的文件：

root@Ubuntu-1:/usr/local/hadoop-2.6.0# bin/hdfs dfs -ls hdfs://Ubuntu-1:9000/user/root/.Trash/Current
Found 1 items
drwxr-xr-x - root supergroup 0 2017-05-19 11:02 hdfs://Ubuntu-1:9000/user/root/.Trash/Current/test

//撤回回收站的文件

root@Ubuntu-1:/usr/local/hadoop-2.6.0# bin/hadoop fs -mv /user/root/.Trash/Current /user/root/test

//文件已撤回

root@Ubuntu-1:/usr/local/hadoop-2.6.0# bin/hadoop fs -ls

Found 2 items

drwx------   - root supergroup          0 2017-05-22 16:12 .Trash

drwx------   - root supergroup          0 2017-05-22 15:39 test

3）使用java代码操作HDFS的回收站

import java.io.IOException;

import org.apache.commons.logging.Log;

import org.apache.commons.logging.LogFactory;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.fs.Trash;

public class RMFile {

    private final static Log log = LogFactory.getLog(RMFile.class);

    private final static Configuration conf = new Configuration();

    /**

     * Delete a file/directory on hdfs

     *

     * @param path

     * @param recursive

     * @return

     * @throws IOException

     */

    public static boolean rm(FileSystem fs, Path path, boolean recursive)

            throws IOException {

        log.info("rm: " + path + " recursive: " + recursive);

        boolean ret = fs.delete(path, recursive);

        if (ret)

            log.info("rm: " + path);

        return ret;

    }

    /**

     * Delete a file/directory on hdfs,and move a file/directory to Trash

     * @param fs

     * @param path

     * @param recursive

     * @param skipTrash

     * @return

     * @throws IOException

     */

    public static boolean rm(FileSystem fs, Path path, boolean recursive,

            boolean skipTrash) throws IOException {

        log.info("rm: " + path + " recursive: " + recursive+" skipTrash:"+skipTrash);

        if (!skipTrash) {

            Trash trashTmp = new Trash(fs, conf);

            if (trashTmp.moveToTrash(path)) {

                log.info("Moved to trash: " + path);

                return true;

            }

        }

        boolean ret = fs.delete(path, recursive);

        if (ret)

            log.info("rm: " + path);

        return ret;

    }

    public static void main(String[] args) throws IOException {

        conf.set("fs.default.name", "hdfs://data2.kt:8020/");

        FileSystem fs = FileSystem.get(conf);

        RMFile.rm(fs,new Path("hdfs://data2.kt:8020/test/testrm"),true,false);

    }

}

HDFS 的Trash回收站的更多相关文章

HDFS的Trash回收站功能
文件的删除和恢复和Linux系统的回收站设计一样,HDFS会为每一个用户创建一个回收站目录:/user/用户名/.Trash/,每一个被用户通过Shell删除的文件/目录,在系统回收站中都一个周期, ...
Hadoop Trash回收站使用指南
转载:https://blog.csdn.net/sunnyyoona/article/details/78869778 我们在删除一个文件时,遇到如下问题,提示我们不能删除文件放回回收站: sudo ...
CM记录-HDFS清理垃圾回收站
HDFS数据块所在存储的目录满了的解决方法 1.增加磁盘空间 2.删除回收站 hadoop dfs -du -h 查看各个HDFS空间占用情况 hadoop dfs -expunge 清空回收站 ...
大数据之路week07--day01（HDFS学习，Java代码操作HDFS，将HDFS文件内容存入到Mysql）
一.HDFS概述数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统 ...
Hadoop回收站及fs.trash参数详解
前言: Linux系统里,个人觉得最大的不方便之一就是没有回收站的概念.rm -rf很容易造成极大的损失.而在Hadoop或者说HDFS里面,有trash(回收站)的概念,可以使得数据被误删以后,还可 ...
Hadoop学习（2）-- HDFS
随着信息技术的高度发展,数据量越来越多,当一个操作系统管辖范围存储不下时,只能将数据分配到更多的磁盘中存储,但是数据分散在多台磁盘上非常不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,因此诞 ...
hadoop进阶---hadoop性能优化(一)---hdfs空间不足的管理优化
Hadoop 空间不足,hive首先就会没法跑了,进度始终是0%. 将HDFS备份数降低将默认的备份数3设置为2. 步骤:CDH–>HDFS–>配置–>搜索dfs.replicat ...
如何有效恢复误删的HDFS文件
HDFS是大数据领域比较知名的分布式存储系统,作为大数据相关从业人员,每天处理HDFS上的文件数据是常规操作.这就容易带来一个问题,实际操作中对重要数据文件的误删,那么如何恢复这些文件,就显得尤为重要 ...
[DB] HDFS
体系架构 NameNode HDFS主节点.管理员接收客户端(命令行.Java程序)的请求:创建目录.上传.下载.删除数据管理和维护HDFS的日志和元信息日志文件(edits文件) 二进制文件, ...

随机推荐

git删除本地及远程分支
1. 删除本地分支: git branch -d branchName 2. 删除远程分支: // 方法一:将删除的本地分支推到远程(要删除的远程分支在本地有映射) git push origin : ...
uwsgi配置文件
[uwsgi] http = :9000 #the local unix socket file than commnuincate to Nginx #socket端口这个用作nginx与其通讯 s ...
Linux的系统安全设置Shell脚本
#!/bin/sh # desc: setup linux system security # powered by www.lvtao.net #account setup passwd -l xf ...
HBase全网最佳学习资料汇总
HBase全网最佳学习资料汇总摘要: HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴.百度.腾讯.京东.小米都有数千台的HBase集群,中国电信的话 ...
ES5新增数组方法（2）：map
通过指定函数处理数组的每个元素,并返回处理后的数组. 1.计算数组中每个元素的平方 let arr = [1, 2, 3, 4, 5, 6]; let newArr = arr.map(item =& ...
VM实例的生命周期管理
有的操作功能比较类似,也有各自的适用场景,简单介绍下上述几个重要的操作: 常规操作: 常规操作中,Launch.Start.Reboot.Shut Off 和 Terminate 都很好理解. 下面几 ...
（原创）像极了爱情的详解排序二叉树，一秒get
排序二叉树(建立.查找.删除) 二叉树我们已经非常熟悉了,但是除了寻常的储存数据.遍历结构,我们还能用二叉树做什么呢? 我们都知道不同的遍历方式会对相同的树中产生不同的序列结果,排序二叉树就是利用二叉 ...
LeetCode - 20. Valid Parentheses(0ms)
Given a string containing just the characters '(', ')', '{', '}', '[' and ']', determine if the inpu ...
Android之Audio和Video
The Android platform offers built-in encoding/decoding for a variety of common media types, so that ...
HDU 4571 Travel in time（最短路径+DP）（2013 ACM-ICPC长沙赛区全国邀请赛）
Problem Description Bob gets tired of playing games, leaves Alice, and travels to Changsha alone. Yu ...

HDFS 的Trash回收站

HDFS 的Trash回收站的更多相关文章

随机推荐

热门专题