Hive表误删恢复

一、简介

因hive表删除后，hdfs文件会先放入回收站，定期清理回收站。在回收之前可以进行清理数据

二、恢复步骤

2.1 看表存储是否损坏
select type from dw.ods_test1 group by type

2.2 查看表hdfs文件存储位置

show create table dw.ods_test1
'ofs://f4.com/user/hive/warehouse/dw.db/ods_test1'

2.3 查看历史路径
ofs://f4.com/user/hadoop/.Trash/Current/user/hive/warehouse/dw.db/ods_test1_back

2.4 查找上一个back任务全量数据，因为删除多次会生成多个文件夹
hdfs dfs -ls ofs://f4.com/user/hadoop/.Trash/Current/user/hive/warehouse/dw.db| grep ods_test1_back

2.5 找到任务调度失败上一个周期数据。例8点失败，去hdfs找7点周期数据（2022-07-16 07:23）
ofs://f4.com/user/hadoop/.Trash/Current/user/hive/warehouse/dw.db/ods_test1_back1657929956643

2.6 因线上表损坏，可以备份后删除线上文件

hdfs dfs -rm -r ofs://f4.com/user/hive/warehouse/dw.db/ods_test1/*

2.7 挪动回收站文件到线上表，完成数据恢复

hdfs dfs -mv ofs://f4.com/user/hadoop/.Trash/Current/user/hive/warehouse/dw.db/ods_test1_back1657929956643/* ofs://f4.com/user/hive/warehouse/dw.db/ods_test1/

2.8 测试数据是否恢复正常

检查下数据，查看是否执行失败,可以根据一个枚举值较少的字段group by

select type from dw.ods_test1 group by type

Hive表误删恢复的更多相关文章

oracle数据表误删恢复
1.查看回收站中的表: select object_name,original_name,partition_name,type,ts_name,createtime,droptime from re ...
Oracle 数据表误删恢复 Flashback
1. 前提条件. recyclebin 参数打开. 验证参数是否打开: SHOW PARAMETER RECYCLEBIN 2. 如果参数没有打开的话需要打开,并且重启一下数据库方法为 alter ...
ORACLE表的恢复
对误删的表,只要没有使用PURGE永久删除选项,那么从flash back区恢复回来希望是挺大的.一般步骤有: 1.从flash back里查询被删除的表 select * from ...
【原创】大叔经验分享（8）创建hive表时用内部表还是外部表
内部表和外部表最主要的一个差别就是删除表或者删除分区时,底层的文件是否自动删除,内部表会自动删除,外部表不会自动删除,所以基础数据表一定要用外部表,即使误删表或分区之后,还可以很容易的恢复回来. 虽然 ...
ORACLE数据库误删恢复
一.表的恢复对误删的表,只要没有使用PURGE永久删除选项,那么从flash back区恢复回来希望是挺大的.一般步骤有: 1.从flash back里查询被删除的表 select * from r ...
hive 表分区操作
hive的数据查询一般会扫描整个表,当表数据太大时,就会消耗些时间,有时候我们只需要对部分数据感兴趣,所以hive引入了分区的概念 hive的表分区区别于一般的分布式分区(hash分区,范围分区 ...
如何快速把hdfs数据动态导入到hive表
1. hdfs 文件 {"retCode":1,"retMsg":"Success","data":[{" ...
HDFS文件和HIVE表的一些操作
1. hadoop fs -ls 可以查看HDFS文件后面不加目录参数的话,默认当前用户的目录./user/当前用户 $ hadoop fs -ls 16/05/19 10:40:10 WARN ...
用puthivestreaming把hdfs里的数据流到hive表
全景图: 1. 创建hive表 CREATE TABLE IF NOT EXISTS newsinfo.test( name STRING ) CLUSTERED BY (name)INTO 3 ...
spark使用Hive表操作
spark Hive表操作之前很长一段时间是通过hiveServer操作Hive表的,一旦hiveServer宕掉就无法进行操作. 比如说一个修改表分区的操作一.使用HiveServer的方式 v ...

随机推荐

Graylog之安装
Graylog是一个开源的日志聚合.分析.审计.展现和预警工具.功能上和ELK类似,但又比ELK要简单,依靠着更加简洁,高效,部署使用简单的优势很快受到许多人的青睐安装部署: 单机部署,最小化部署 ...
用VuePress在GitHub Pages上搭建博客
请先点击链接RobinDevNotes,体验用VuePress搭建博客的效果(logo还没有合适的替换),目前部署在GitHub Pages上,国内访问速度还可以,再阅读本文感受来龙去脉和搭建过程. ...
win7下使用Aero2主题错误
开发了一个gui工具,有同事在win7环境下发现界面无法加载出来. 经过调试发现,在view初始化的过程中,提示PresentationFramework.Aero2无法加载,异常信息如下: {Sys ...
Gitlab:Restoring PostgreSQL database gitlabhq_production ... ERROR: must be owner of extension pg_trgm
Restoring PostgreSQL database gitlabhq_production ... ERROR: must be owner of extension pg_trgm ERRO ...
idea配置gradle国内镜像源
项目文件中找到build.gradle文件,修改其中的buildscript和allprojects地址: buildscript { repositories { maven{ url 'http: ...
GraphQL Part VIII: 使用一对多查询
今天,我们引入两个新的实体来处理客户与订单.客户与订单之间是一对多的关系,一个客户可以拥有一个或者多个订单,反过来,一个订单只能被某个客户所拥有. 可以按照 Engity Framework 的约定配 ...
RepeatReadRequestWrapper
package cn.service.web.common.filter; import com.alibaba.fastjson.JSON; import org.apache.commons.io ...
JVM实战—2.JVM内存设置与对象分配流转
大纲 1.JVM内存划分的原理细节 2.对象在JVM内存中如何分配如何流转 3.部署线上系统时如何设置JVM内存大小 4.如何设置JVM堆内存大小 5.如何设置JVM栈内存与永久代大小 6.问题汇总 ...
Qt编写的项目作品15-皮肤生成器+UIDemo
一.功能特点自带17套精美皮肤样式,其中包括黑色.灰色.扁平等. 皮肤生成器只需要简单几步就可以生成一套自定义的皮肤. 自带了26种uidemo,非常漂亮美观,涵盖了主界面布局.菜单切换等各种效果, ...
Qt通用方法及类库4
函数名 //九宫格图片 horzSplit-宫格1/3/7/9宽度 vertSplit-宫格1/3/7/9高度 dstWidth-目标图片宽度 dstHeight-目标图片高度 static QPix ...

Hive表误删恢复

Hive表误删恢复的更多相关文章

随机推荐

热门专题