harbor定时清理镜像

​ 分享下最近写harbor仓库镜像自动清理脚本思路,很长时间不写shell脚本,这次的脚本也是匆匆写的,还有很多可优化点,感兴趣的可以参考自己优化下,写的不完善地方也希望指出。

​ 说下harbor仓库清理的思路,其实思路也比较简单,就是找到要清除的镜像地址,根据自己需要对时间排序清除不需要的就行。那么关键点来了,如何有效找出需清除的镜像和时间tag关联起来呢这是问题的核心,在写脚本前也参考了网上他人的脚本,大部分人都是通过python实现的,用shell实现的也无法满足我的需求,那接下来刨析下我的脚本。

  • 环境需求

    harbor1.7.4

    保留近期5个镜像

    tag是没构建一次+1操作,但是因为实际也不确定可能存在误差就没有从这个方向考虑

  • 思路:

    1. 找出所有满足5个镜像以上的镜像
    2. 根据找到的镜像名称对应时间排序
    3. 找到关联时间的tag删除

harbor提供了众多的api,我这里只有一个项目,多个项目的可以参考举一反三

# 查找项目下所有对应的镜像信息
curl -s -k -X GET "https://${harbor_user}:${harbor_passwd}@${harbor_url}/api/search?q=项目名称" # 获取指定镜像信息(镜像仓库地址格式化切割,将"/"换成"%2F")
curl -s -k -X GET "https://${harbor_user}:${harbor_passwd}@${harbor_url}/api/repositories/镜像仓库名称/tags" #删除镜像(tag根据实际情况来写)
curl -s -k -X DELETE "https://${harbor_user}:${harbor_passwd}@${harbor_url}/api/repositories/镜像仓库名称/tags/具体的tag"
  1. 找出所有满足5个镜像以上的镜像

    # 通过api查找到所有对应的镜像地址,这里有个"tags_count"就是镜像的tag数,通过tag数判断>5筛选出对应的镜像"repository_name",刚开始一直在想通过管道连接的方式一条语句判断出来,结果确实没有想到好的方法判断出来,退而求其次选择了现在的方法,将获取到的值保存到文件中,根据自己的需要构造一个新的文件。
    
    #获取所有tags_count
    COUNT=$(curl -s -k -X GET "https://${harbor_user}:${harbor_passwd}@${harbor_url}/api/search?q=项目名称 " |grep "\"tags_count\""|awk -F "\"" '{print $3$4}' | awk -F "" '{print $3$4}') #获取所有repository_name
    REPS=$(curl -s -k -X GET "https://${harbor_user}:${harbor_passwd}@${harbor_url}/api/search?q=项目名称 " |grep "\"repository_name\""|awk -F "\"" '{print $4}') # 接下来就是根据需求造文件,我这里想要的格式是 tags_count ,repository_name在同一行一一对应关联起来。 for i in $COUNT
    do
    echo $i >> test_count.txt
    done
    for y in $REPS
    do
    echo $y >> test_server.txt
    done #合并俩个文件拼接出新的文件,新的文件count_and_server.txt里面存放的就是我们造好的数据。
    paste test_count.txt test_server.txt > count_and_server.txt #删除不需要的文件
    rm -rf test_count.txt
    rm -rf test_server.txt
    rm -rf server.txt #循环读取每一行并判断,这里根据tab切割第一个值是tags_count,第二个值对应repository_name,判断大于5将服务读取到server.txt,这样server.txt里面就是我们所有需要清除的镜像
    FILENAME=count_and_server.txt cat $FILENAME | while read LINE
    do
    new_str=$(echo $LINE | cut -d " " -f1)
    new_str1=$(echo $LINE | cut -d " " -f2)
    if [ $new_str -gt 5 ]
    then
    echo $new_str1 >> server.txt
    fi
    done
  2. 根据找到的镜像名称对应时间排序并删除

    # 通过server.txt里面的镜像我们就可以找对应的created时间
    
    # 替换server.txt文件中"/""
    sed -i 's@\/@%2F@g' server.txt # #通过server.txt文件找到所有可删除的时间
    SERVER_NAME=server.txt
    cat $SERVER_NAME | while read LINE
    do
    # 继续造文件,造一个时间和tag名称对应的文件,这里文件是奇数行是created时间。偶数行是tag名称
    name_date=$(curl -s -k -X GET "https://${harbor_user}:${harbor_passwd}@${harbor_url}/api/repositories/${LINE}/tags" |egrep "\"created|name\""|awk -F "\"" '{print $4}') for date in $name_date
    do
    echo $date >> date.txt
    done
    echo "++++++++++++++++++++++++++++++++++" #合并两行,将时间和tag名称放到一行一一对应
    awk '{if(NR%2!=0)ORS=" ";else ORS="\n"}1' date.txt >> new_date.txt # 按时间排序
    sort -r new_date.txt > new1_date.txt #删除不需要的文件
    rm -rf new_date.txt
    rm -rf date.txt
    #根据时间排序删除从第6行开始以后
    # !!!这部可以验证所有待删除的tag,对比harbor仓库是否一致
    NEW_DEL=new1_date.txt
    del_tag=$(cat new1_date.txt | tail -n +6 | awk -F' ' '{print $1}') # 可以查看到所有满足删除需求的
    echo $del_tag
    echo "===========================================" #根据tag执行软删除
    #curl -s -k -X DELETE "https://${harbor_user}:${harbor_passwd}@${harbor_url}/api/repositories/${LINE}/tags/${del_tag}"
    done
  3. 基本上整个脚本就结束了,不过这样的删除只是在ui中删除并不是真正意义的删除,还需要执行harbor命令清空Gc才能真正释放资源

    #硬删除,根据自己版本
    #cd ${HARBOR_PAHT} #docker-compose stop
    #docker run -it --name gc --rm --volumes-from registry vmware/registry:2.6.2-photon garbage-collect --dry-run /etc/registry/config.yml
  4. 完整脚本走一波

    #! /bin/bash
    
    HARBOR_PAHT=""
    
    COUNT=$(curl -s -k -X GET "https://${harbor_user}:${harbor_passwd}@${harbor_url}/api/search?q=项目名称 " |grep "\"tags_count\""|awk -F "\"" '{print $3$4}' | awk -F "" '{print $3$4}')
    
    REPS=$(curl -s -k -X GET "https://${harbor_user}:${harbor_passwd}@${harbor_url}/api/search?q=项目名称 " |grep "\"repository_name\""|awk -F "\"" '{print $4}')
    for i in $COUNT
    do
    echo $i >> test_count.txt
    done
    for y in $REPS
    do
    echo $y >> test_server.txt
    done paste test_count.txt test_server.txt > count_and_server.txt
    rm -rf test_count.txt
    rm -rf test_server.txt
    rm -rf server.txt FILENAME=count_and_server.txt cat $FILENAME | while read LINE
    do
    new_str=$(echo $LINE | cut -d " " -f1)
    new_str1=$(echo $LINE | cut -d " " -f2)
    if [ $new_str -gt 5 ]
    then
    echo $new_str1 >> server.txt
    fi
    done sed -i 's@\/@%2F@g' server.txt SERVER_NAME=server.txt
    cat $SERVER_NAME | while read LINE
    do name_date=$(curl -s -k -X GET "https://${harbor_user}:${harbor_passwd}@${harbor_url}/api/repositories/${LINE}/tags" |egrep "\"created|name\""|awk -F "\"" '{print $4}') for date in $name_date
    do
    echo $date >> date.txt
    done awk '{if(NR%2!=0)ORS=" ";else ORS="\n"}1' date.txt >> new_date.txtawk '{if(NR%2!=0)ORS=" ";else ORS="\n"}1' date.txt >> new_date.txt
    sort -r new_date.txt > new1_date.txt
    rm -rf new_date.txt
    rm -rf date.txt NEW_DEL=new1_date.txt
    del_tag=$(cat new1_date.txt | tail -n +6 | awk -F' ' '{print $1}') curl -s -k -X DELETE "https://${harbor_user}:${harbor_passwd}@${harbor_url}/api/repositories/${LINE}/tags/${del_tag}"
    done cd ${HARBOR_PAHT} docker-compose stop
    docker run -it --name gc --rm --volumes-from registry vmware/registry:2.6.2-photon garbage-collect --dry-run /etc/registry/config.yml #最后启动harbor
    ./install

    有更好方法的欢迎讨论

harbor自动清理镜像的更多相关文章

  1. Harbor 清理镜像(此方法比较粗暴,但是有效)

    0x00 事件 Harbor 私有仓库中占有的存储慢慢越来越大,使用官方的清理工具以及 UI 上的垃圾清理,都似乎也不能清理掉-- 后来吾用了一种简单粗暴的方法清理镜像--删除 harbor regi ...

  2. (十七)VMware Harbor 垃圾清理

    1. 在线垃圾清理 注意:从Harbor中删除镜像时不释放空间,垃圾收集是通过从清单中不再引用文件系统中删除blob来释放空间的任务. 注意:在执行垃圾收集时,Harbor将进入只读模式,并且禁止对d ...

  3. 微服务架构 - 基于Harbor构建本地镜像仓库

    之前写过<搭建docker本地镜像仓库并提供权限校验及UI界面>文章,然后有同仁评论道这样做太复杂了,如果Harbor来搭建会更简单同时功能也更强大.于是抽时间研究了基于Harbor构建本 ...

  4. wordpress自动清理评论回收站

    有时wordpress的垃圾评论实在让人心烦,杂草难除根,footprint吹又生.如果你有心情的话会一个个把垃圾评论放入回收站,但是时间一长,回收站里的东西越堆越多,你可以点击回收站,然后再点一下e ...

  5. 自动清理SQLServerErrorLog错误日志避免太大

    问题描述:开启SQLServer自动备份后,备份文件越来越多,有没有及时清理,导致服务器空间不足,备份出错,以至于出现几个G的ErrorLog文件,影响系统的登录管理. 解决办法:定期清理SQLSer ...

  6. Tomcat8.5.24日志自动清理(maxDays)功能探究

    前言 测试人员反馈tomcat目录下的日志占用空间很大,需要自动清理.接到这个反馈时,想象着应该是一个很简单的功能,tomcat应该已经实现了日志的自动清理功能.于是乎,我先到网上查询了如何自动清除t ...

  7. Docker 删除&清理镜像

    文章首发自个人网站:https://www.exception.site/docker/docker-delete-image 本文中,您将学习 Docker 如何删除及清理镜像? 一.通过标签删除镜 ...

  8. hive 中间会话临时文件自动清理脚本

    hive在运行过程中,我们经常会发现 hdfs /tmp/hive/hive or hdfs 目录占用空间巨大,我这里已经清理过了所以,相对较小.但是初次使用hive的用户,一定会发现 随着时间的推移 ...

  9. zookeeper3.4.6配置实现自动清理日志【转】

    在使用zookeeper过程中,我们知道,会有dataDir和dataLogDir两个目录,分别用于snapshot和事务日志的输出(默认情况下只有dataDir目录,snapshot和事务日志都保存 ...

随机推荐

  1. springboot多数据源+jta事务管理配置

    1.创建一个maven项目,导入相关配置: <?xml version="1.0" encoding="UTF-8"?> <project x ...

  2. 二十五、SSH服务企业级应用场景

    一.需求分析: 要求所有服务器在同一个用户oldboy1系统用户下,实现A机器从本地分发数据到B\C机器上,在分发过程中不需要B\C的提示系统密码验证,除了分发功能,还需要可以批量查看客户上的cpu. ...

  3. LeetCode No.124,125,126

    No.124 MaxPathSum 二叉树中的最大路径和 题目 给定一个非空二叉树,返回其最大路径和. 本题中,路径被定义为一条从树中任意节点出发,达到任意节点的序列.该路径至少包含一个节点,且不一定 ...

  4. 使用idea创建spring mvc项目图文教程

    使用idea创建spring mvc项目图文教程 前言: 使用惯了eclipse的朋友,如果刚换成了idea或许有些不习惯.但是使用idea之后,就会love上idea了.本文将通过图文讲解怎么通过i ...

  5. VS工程的相对路径写法

    最近搭建一个VS工程的框架,为了让所有人都能直接使用,要使用相对路径,下面的几种常见路径的写法: 1.两个点“..\”表示在工程文件(*.vcxproj)的上一级目录. 2.一个点“.\”则表示和工程 ...

  6. ABC:Meaningful Mean

    题目描述 You are given an integer sequence of length N, a= {a1,a2,…,aN}, and an integer K. a has N(N+1)⁄ ...

  7. BBuBBBlesort!

    题目描述 Snuke got an integer sequence of length N from his mother, as a birthday present. The i-th (1≦i ...

  8. Leetcode9_回文数

    哈哈哈哈哈哈哈太开心了,今天的代码耗时和内存消耗比官方少了一半哈哈 (因为官方用C#写的,我用C++,手动狗头) 题目 判断一个整数是否是回文数.回文数是指正序(从左向右)和倒序(从右向左)读都是一样 ...

  9. Zabbix - 修改默认的 Web 访问URL

    背景 CentOS 7 64 Zabbix 4 LTS 使用RPM在线方式安装 修改过程 # 修改默认的访问路径:http://x.x.x.x/zabbix 修改为 http://x.x.x.x/ v ...

  10. python数据类型:字典Dictionary

    python数据类型:字典Dictionary 字典是一种可变容器模型,可以存储任意类型对象 键是唯一的,但是值不需要唯一 值可以取任何数据类型,但是键必须是不可变的,如字符串,数字,元组 创建字典: ...