【问题排查过程】vm-backup的snapshots导致磁盘满

使用中发现，vm-storage节点仅仅过了6天，就占用了800GB的硬盘空间。很不正常。下面是排查过程：

1.查看磁盘占用情况：

先登录容器，执行：

df -h

/dev/vdb               1012.8G    870.2G    142.7G  86% /var/victoria-metrics/data

2.查看节点上的time series总数：

为了方便使用，我在vm-storage节点上部署了vm-select:

curl -G "http://127.0.0.1:8481/select/0/prometheus/api/v1/series/count"

{"status":"success","isPartial":false,"data":[71273032]}

才7000万，并不算多。

2.研究究竟是哪些文件夹占用空间多

du /var/victoria-metrics/data/ -h -d 4

3.3G    /var/victoria-metrics/data/data/small/2022_01

285.5G  /var/victoria-metrics/data/data/small/snapshots   #太多的快照了

288.8G  /var/victoria-metrics/data/data/small

110.9G  /var/victoria-metrics/data/data/big/2022_01

323.9G  /var/victoria-metrics/data/data/big/snapshots      #太多的快照了

434.8G  /var/victoria-metrics/data/data/big

723.6G  /var/victoria-metrics/data/data

很奇怪，我备份的时候，是指定了deleteURL的。备份脚本如下：

./vmbackup-prod \

  -configFilePath="/etc/cos/config.ini" \

  -credsFilePath="/etc/cos/creds.ini" \

  -customS3Endpoint="https://cos.ap-guangzhou.myqcloud.com" \

  -dst="s3://bucket-125800000/tenant/Production/formal/vm-storage/0/2022-01-06" \

  -origin="s3://bucket-125800000/tenant/Production/formal/vm-storage/0/2022-01-06" \

  -storageDataPath="/data" \

  -httpListenAddr="0.0.0.0:8420" \

  -memory.allowedBytes=2GB \

  -concurrency=5 \

  -maxBytesPerSecond=20MB \

  -snapshot.createURL="http://127.0.0.1:8482/snapshot/create" \

  -snapshot.deleteURL="http://127.0.0.1:8482/snapshot/delete" &

那么有可能备份完成后，vmbackup并没有去删除快照。

3.手动删除所有快照

curl -G "http://127.0.0.1:8482/snapshot/delete_all"

再看磁盘空间：

/dev/vdb               1012.8G    148.3G    864.6G  15% /var/victoria-metrics/data

这下正常了。

于是提了一个issue给VictoriaMetrics.

目前看来，备份完成后立即执行delete_all才行。

【问题排查过程】vm-backup的snapshots导致磁盘满的更多相关文章

crfclust.bdb导致磁盘满
检查ora.crf服务 crsctl stat res ora.crf -init -t 关闭ora.crf服务 crsctl stop res ora.crf -init cd $ORACLE_HO ...
使用django uwsgi 导致磁盘满
lsof |grep delete |sort -nrk 7|more kill 掉这些进程
解Bug之路-记一次中间件导致的慢SQL排查过程
解Bug之路-记一次中间件导致的慢SQL排查过程前言最近发现线上出现一个奇葩的问题,这问题让笔者定位了好长时间,期间排查问题的过程还是挺有意思的,正好博客也好久不更新了,就以此为素材写出了本篇文章 ...
记录一次mybatis缓存和事务传播行为导致ut挂的排查过程
起因 rhea项目有两个ut一直都是挂的,之前也经过几个同事排查过,但是都没有找到解决办法,慢慢的这个问题就搁置了.因为之前负责rhea项目的同事离职,我临时接手了这个项目,刚好最近来了一个新同事在做 ...
一次kibana服务失败的排查过程
公司在kubernetes集群上稳定运行数月的kibana服务于昨天下午突然无法正常提供服务,访问kibana地址后提示如下信息: 排查过程: 看到提示后,第一反应肯定是检查elasticsearch ...
基于TBDS的flume异常问题排查过程
版权声明:本文由王亮原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/214 来源:腾云阁 https://www.qclou ...
记一次生产环境Nginx日志骤增的问题排查过程
摘要:众所周知,Nginx是目前最流行的Web Server之一,也广泛应用于负载均衡.反向代理等服务,但使用过程中可能因为对Nginx工作原理.变量含义理解错误,或是参数配置不当导致Nginx工作异 ...
干货！一次kafka卡顿事故排查过程
由于一次功能上线后,导致某数据量急剧下滑,给我们紧张的呢!排查过程也是个学习过程(这其中有大部分是领导们的功劳,不过分享给大家应该也不犯法吧,ᐓ) 1. 确认问题的真实性? 被数据部门告知,某数据量下 ...
Linux(2)---记录一次线上服务 CPU 100%的排查过程
Linux(2)---记录一次线上服务 CPU 100%的排查过程当时产生CPU飙升接近100%的原因是因为项目中的websocket时时断开又重连导致CPU飙升接近100% .如何排查的呢是通过 ...

随机推荐

LuoguP7715 「EZEC-10」Shape 题解
Content 有一个 $n\times m$ 的网格,网格上的格子被涂成了白色或者黑色. 设两个点 $(x_1,y_1)$ 和 $(x_2,y_2)$,如果以下三个条件均满足: \(1\ ...
CF1506A Strange Table 题解
Content 给定一个 $n\times m$ 的矩阵.一开始,$(1,1)$ 所在位置上面的数是 $1$,随后先由上往下将这一列中的所有位置上面填上 $2,3,\dots,n$,再 ...
多进程 multiprocessing 模块进程并发Process；Pool ；Queue队列、threading模块；
multiprocessing 模块中的 Process类提供了跨平台的多进程功能,在windows和linux系统都可以使用. 1.首先要实例化一个类,传入要执行的函数. 实例名 = Process ...
PHP伪协议-文件包含
lfi.php案例代码 <?php include $_GET['file']; ?> phar://.zip://.zlib:// 用于读取压缩文件,zip:// .phart:// ...
【LeetCode】374. Guess Number Higher or Lower 解题报告（Java & Python）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法日期题目地址:https://leetcode.c ...
【LeetCode】67. Add Binary 解题报告（Python）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法 BigInteger类模拟加法日期题目地址:h ...
【LeetCode】672. Bulb Switcher II 解题报告（Python）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法日期题目地址:https://leetcode.c ...
【LeetCode】328. Odd Even Linked List 解题报告（Python & C++）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法日期题目地址:https://leetcode.c ...
linux - 运维知识
使用nmap检测服务器端口安全性 https://blog.csdn.net/jayjaydream/article/details/108555250
CS5211替代CH7511B|设计DP转LVDS转接板|替代CH7511B
CH7511B是一款DP转lvds屏转换芯片CH7511B是一款eDP转LVDS转换芯片.CH7511B将嵌入式DisplayPort信号转换为LVDS(低压差分信号).通过CH7511B的高级解码/ ...