HBase按照行键范围删除数据

#!/bin/bash

#TOOL_PATH=$(cd "$(dirname "$0")"; pwd)

#TOOL_PATH_TMP=$(cd "$(dirname "$0")"; pwd)

if [ $# != 3 ];then

        echo 'usage:sh byRowKeyRange.sh table startrowkey endrowkey'

        exit

fi

table=$1

srowkey=$2

erowkey=$3

echo $table

echo $srowkey

echo $erowkey

currentTime=`date +%s`

echo "scan,get rowkeys,scan: '$table',{ STARTROW => '$srowkey',ENDROW => '$erowkey',FILTER => \"FirstKeyOnlyFilter() AND KeyOnlyFilter()\" } "

#notice:[srowkey,erowkey)!!!

echo "scan '$table',{ STARTROW => '$srowkey',ENDROW => '$erowkey',FILTER => \"FirstKeyOnlyFilter() AND KeyOnlyFilter()\" }" | hbase shell > ./scanresult-$currentTime.txt

#删除scan结果文件前面没用的6行

sed -i '1,6d' scanresult-$currentTime.txt

#删除最后一个空行

sed -i '$d' scanresult-$currentTime.txt

#删除scan统计条数的行，现在位置在最后

sed -i '$d' scanresult-$currentTime.txt

#判断下是否查询结果，没有则直接退出

tmpCount=$(wc -l ./scanresult-$currentTime.txt | awk '{print $1}')

if [ "$tmpCount" -eq 0 ];then

        echo "0 rows deleted"

        rm -rf ./scanresult-$currentTime.txt

        exit

fi

#生成hbase 删除语句

cat scanresult-$currentTime.txt|awk '{print $1}' | while read rowkey

do

echo -e "deleteall '${table}','${rowkey}'" >> ./delete-$currentTime.txt

done

totalCount=$(wc -l ./delete-$currentTime.txt | awk '{print $1}')

echo "exit" >> ./delete-$currentTime.txt

#执行hbase删除

hbase shell ./delete-$currentTime.txt

echo "$totalCount records deleted"

#rm -rf ./scanresult-$currentTime.txt

#rm -rf ./delete-$currentTime.txt

KeyOnlyFilter：只会返回每行的行键+列簇+列，而不返回值

FirstKeyOnlyFilter：找每一行的第一列数据，找到之后，就会停止扫描，会返回列值

参考：https://blog.csdn.net/nyistzp/article/details/76922512

HBase按照行键范围删除数据的更多相关文章

记一次Hbase的行键过滤器事故问题
数据总数:746条数据因为后面需要进行算法合成,而且spark目前对这种算法支持并不好,因此采用代码编写,所以在查询hbase的过程中采用的是java直接查询, 但是为了加快查询速度,我尽可能的使用 ...
mysql自增长主键，删除数据后，将主键顺序重新排序
用数据库的时候,难免会删除数据,会发现设置的主键增长不是按照正常顺序排列,中间有断隔比如这样. 以我这个情况举例处理方法的原理:删除原有的自增ID,重新建立新的自增ID. ALTER TABLE ` ...
Hadoop HBase概念学习系列之优秀行键设计（十六）
我们通过行键访问HBase.尽管使用扫描过滤器可以一次性指明大量的键,但是HBase仅仅能够根据行键识别出一行. 优秀的行键设计可以保证良好的HBase性能. 1.行键存在于HBase中的每一个单元格 ...
HBase应用开发回顾与总结系列之三：RowKey行键生成器工具
所谓RowKey行键生成器,是指通过软件工具制定行键生成策略,并可将策略信息保存成本地策略文件,待需要时再将本地策略文件序列化成行键生成策略对象,传入数据行信息后可自动生成RowKey行键. 那么 ...
SQL 必知必会·笔记<14>更新和删除数据
1. 更新数据基本的UPDATE语句,由三部分组成: 要更新的表列名和它们的新值确定要更新那些行的过滤条件更新单列示例: UPDATE Customers SET cust_email = ' ...
sql server 笔记（数据类型/新建、修改、删除数据表/）
1.数据类型: Character 字符串 / Unicode 字符串 / Binary 类型 / Number 类型 / Date 类型 / 其他数据类型详解:http://www.w3sc ...
Hadoop-No.7之行键
和哈希表类比,HBase中的行键类似于哈希表中的键.要构造一个良好的HBase模式,关键之一就是选择一个合适的行键. 1 记录检索行键是HBase中检索记录所使用的键.HBase记录含有的列在数量上 ...
HBase应用开发回顾与总结系列之二：RowKey行键设计规范
2. RowKey行键设计规范 2.1. RowKey四大特性 2.1.1 字符串类型虽然行键在HBase中是以byte[]字节数组的形式存储的,但是建议在系统开发过程中将其数据类型设置为Strin ...
架构师必备：HBase行键设计与应用
首先要回答一个问题,为何要使用HBase? 随着业务不断发展.数据量不断增大,MySQL数据库存在这些问题: MySQL支持的数据量为TB级,不能一直保留历史数据.而HBase支持的数据量为PB级,适 ...

随机推荐

使用SpringBoot进行优雅的数据验证
JSR-303 规范在程序进行数据处理之前,对数据进行准确性校验是我们必须要考虑的事情.尽早发现数据错误,不仅可以防止错误向核心业务逻辑蔓延,而且这种错误非常明显,容易发现解决. JSR303 规范 ...
Hadoop大数据平台之Zookeeper搭建
环境:CentOS 7.4 (1708 DVD) 工具:MobaXterm 1. 使用xftp将hadoop上传到/usr/local目录下,将其解压并重命名. 2. 修改环境变量并source. ...
在Guitar Pro中如何调节拍
编辑一首曲子的时候,曲子的节奏往往是很重要的,那节奏一般是怎样设置的呢,在{cms_selflink page='index' text='Guitar Pro'}中,一般是通过调节节拍来完成的,很多 ...
编译安装opssl
wget http://www.openssl.org/source/openssl-1.0.1q.tar.gz tar zxvf openssl-1.0.1q cd openssl-1.0.1q . ...
基于Vue、Springboot网站实现第三方登录之QQ登录，以及邮件发送
基于Vue.Springboot实现第三方登录之QQ登录前言一.前提(准备) 二.QQ登录实现 1.前端 2.后端 1.application.yml 和工具类QQHttpClient 2.QQL ...
蓝桥杯——字母阵列(2018JavaC组第3题)
字母阵列(18JavaC3) 标题:字母阵列仔细寻找,会发现:在下面的8x8的方阵中,隐藏着字母序列:"LANQIAO". SLANQIAO ZOEXCCGB MOAYWKHI ...
败家玩意儿！Redis 竟然浪费了这么多内存！
作为内存数据库,内存空间大小对于 Redis 来说是至关重要的.内存越多,意味着存储的数据也会越多.但是不知道你有没有遇到过这样的情况,明明空间很大,但是内存的使用却不是很理想. 为什么会出现这样的情 ...
python—数据类型和变量
在python中,能够直接处理的数据类型和变量有整数.浮点数.字符串.布尔值.空值.变量. 一.整数 1.python可处理任意大小的整数,包括负整数,在程序中的表示方法与在数学中的方法一样.例如:0 ...
JZOJ2020年8月11日提高组T2 宝石
JZOJ2020年8月11日提高组T2 宝石题目 Description 见上帝动了恻隐之心,天后也想显示一下慈悲之怀,随即从口袋中取出一块魔术方巾,让身边的美神维纳斯拿到后堂的屏风上去试试,屏风是 ...
navicat连接阿里云ESC里的数据库
1.进入阿里云服务器 ssh 用户名@ip 2.进入数据库 mysql -u root -p 3.设置mysql数据库权限(允许其他服务器连接数据库) grant all privileges on ...

HBase按照行键范围删除数据

HBase按照行键范围删除数据的更多相关文章

随机推荐

热门专题