简述: Jenkins在每一次的执行构建后,都会对该构建的项目生成一个历史构建记录以及生成一份历史构建的项目发布包,长期累积可能会占用大量磁盘空间 jenkins构建jobs路径如下图: 解决办法: 删除jenkins旧的构建来释放磁盘空间 1.进入jenkins服务器对应构建Jobs目录删除,如上如的1 3 4 5 6 2.创建构建时勾选“丢弃旧的构建”,如下图…
大概是前俩天吧,发现公司的网站不定时的出现接口调不通的情况,便让手下小弟去服务器上查看一下,小弟告我磁盘空间满了,于是我让他处理一下.结果没想到他直接把 catlina.out 给干掉了.后果可想而知,磁盘空间还是一直是100%,无法使用,他还一脸蒙蔽.大概情况就是这样,下面说一下我解决的过程. 因为catlina.out 是tomcat 的输出日志,只要运行就会有日志输出,所有不能直接删除,要去清空.即当进程打开了某个文件时,只要该进程保持打开该文件,即使将其删除,它依然存在于磁盘中.这意味着…
今天测试过程中发现YARN Node变成Unhealthy了,后来定位到硬盘空间不够..... 通过查找大于100M的文件时发现有N多个spark-assembly-1.4.0-SNAPSHOT-hadoop2.5.0-cdh5.3.1.jar包,大小为170多M, 每提交一个application到yarn上执行,就会上传一个assembly包,application个数一多,磁盘就本占用了N多空间.... 解决方法参见[Spark On Yarn中spark.yarn.jar属性的使用]…
看了一下,有一个wtmp 和wtmp.1的文件非常大.wtmp记录的是机器注销.启动的信息.由此可见,机器长时间的不断重启,造成该日志记录超级大,把cf的空间给占满了. wtmp日志可以用who和last命令来看. who wtmp…
Jenkins在帮助我们自动化构建服务的同时也在消耗服务器的磁盘空间,试想如果构建的项目个数很多,而Jenkins 服务器磁盘空间又不是非常大的话,每隔一段时间磁盘空间就会爆满导致Jenkins出现磁盘空间不足无法构建的后果.这时候我们就需要进行一定的手工干预才能恢复Jenkins的正常运作. 本文基于Windows操作系统,结合Jenkins 的相关特性解决上述问题. 一.手工删除构建记录 这是最基本的一种操作方法,通过直接物理删除构建记录进行磁盘空间管理.手工删除构建记录方式如下: 进入Je…
现象: 从根目录开始,使用du -h -x --max-depth=1  查看哪个目录占用过高,打算对于过高目录中的内容适当删减腾出一些空间 通过追踪查询,发现是jenkins的构建纪录未清理,而且最近我们项目测试构建很频繁,导致磁盘最近爆涨. 注:查看隐藏文件的命令: du -sh .[!.]* * | sort -hr解决方法: 1.手工删除构建记录 这是最基本的一种操作方法,通过直接物理删除构建记录进行磁盘空间管理.手工删除构建记录方式如下:进入Jenkins根目录,Windows下默认位…
lsof简介 在终端下输入lsof即可显示系统打开的文件,因为 lsof 需要访问核心内存和各种文件,所以必须以 root 用户的身份运行它才能够充分地发挥其功能. 直接输入lsof部分输出为: 每行显示一个打开的文件,若不指定条件默认将显示所有进程打开的所有文件. lsof输出各列信息的意义如下: COMMAND:进程的名称 PID: 进程标识符 USER:进程所有者 FD: 文件描述符,应用程序通过文件描述符识别该文件.如cwd.txt等 TYPE:文件类型,如DIR.REG等 DEVICE…
曾经在生产上遇到过一个df 和 du出现的结果不一致的问题,为了排查到底是哪个进程占用了文件句柄,导致空间未释放,首先在linux上面,一切皆文件,这个问题可以使用lsof这个BT的命令来处理(这个哈还可以来查询文件句柄泄露问题,应用程序的进程未关闭文件句柄) 1.文件句柄以及空间释放问题 注:在生产环境常见的问题就是,有维护人员或者开发同事使用tail命令实时查看日志.然后另外的人使用rm命令删除,这有就好导致磁盘空间不会真正的释放,因为你要删除的文件,还有进程在使用,文件句柄没有释放,即ta…
检查ora.crf服务 crsctl stat res ora.crf -init -t 关闭ora.crf服务 crsctl stop res ora.crf -init cd $ORACLE_HOME/crf/db rm *.bdb CHM(ClusterHealth Monitor)服务未关导致crf文件无限增长导致磁盘空间占满 启动ora.crf服务 crsctl start res ora.crf -init…
大家好,我是良许. 硬盘是计算机非常重要的一个部件,不管是代码,还是 UI .声音.文档,抑或是没人时偷偷看的小视频,都需要保存在硬盘里. 对于很多 Linux 服务器,会进行很多的编译操作.而编译操作在很多情况下都会产生大量的中间文件,这些文件会占用很多的磁盘空间,导致磁盘空间一直吃紧. 别问为啥我知道,说多了都是泪. 本文介绍几个命令,一部分与磁盘相关,另一部分与文件相关,帮助大家分析磁盘使用情况,进而释放磁盘空间. ls -al 这个命令大家再熟悉不过了,可以显示当前目录所有文件及目录的详…
今天早上同事反应jenkins构建job发生异常,于是登录机器查看发现磁盘空间已满.进一步排查之后发现jenkins的catalina.out文件已占满磁盘空间. 用tail看了下日志后面都是关于DNS的. [DNSQuestion@1398141921 type: TYPE_IGNORE index 0, class: CLASS_UNKNOWN index 0, name: ][DNSQuestion@752862545 type: TYPE_IGNORE index 0, class: C…
背景 今天登陆jenkins提示磁盘空间不足,且构建发生错误 排查问题 cd到jenkins 安装目录 执行df -h 发现root目录沾满 执行 du -ah --max-depth=1 发现是.jenkins 目录占用的 逐渐cd 进去,并执行 du -ah --max-depth=1 最终发现是jobs目录占用过大 手动删除其中的构建历史 异常恢复 优化解决 jenkins在创建构建项目的时候,直接设置好构建历史保留天数等,见下图 如希望了解更多,请关注微信公众号…
玩Devops的小伙伴应该对Jenkins都有了解. Github上16.8k的Star的项目,1500+的构建.发布等自动化插件可供选择,事实上的业界CICD标准领导者. JFrog.Coding等一众你能见到的企业级的Devops解决方案基本上都是用Jenkins做引擎. 产研流水线用Jenkins可以说真的很香.​但是前几天它突然不听话了,它也有不香的时候,手动裂开. 前几天在做一个jenkins job的迁移,由于是第一次搞,在迁移的过程中遇到了小意外,出了点小插曲. 起因是在迁移的过程…
oracle所在磁盘空间不足导致了数据库异常.需要减小数据文件的大小来解决. 1.检查数据文件的名称和编号 select file#,name from v$datafile; 2.看哪个数据文件所占的空间最大,根据该数据文件的编号查看该数据文件的最大数据块数 select max(block_id) from dba_extents where file_id=8; 查询结果 3.计算该表空间的实际占用空间.(不是物理文件的大小) 查看每个数据块的大小 show parameter db_bl…
今天遇到了两个关于Reporting Service的问题, 出现问题的环境为Microsoft SQL Server 2008 R2 (SP2) - 10.50.4000.0 (X64) .具体情况请见下面描述. 1:在修改报表的订阅后,保存时出现下面错误: 提示:报表服务器数据库内出错.此错误可能是因连接失败.超时或数据库中磁盘空间不足而导致的. (rsReportServerDatabaseError) 获取联机帮助 有关此错误的详细信息,请导航到本地服务器上的报表服务器或启用远程错误 从…
在一次测试中,由于导入的数据量过大导致事务一直提交失败因为磁盘空间不够用了,一检查发现是undo表空间不够用,于是重新创建了一个表空间,准备把之前的undo表空间删除,删除时却发现一直删不掉,因为它一直在使用,于是关闭数据库,手动的删掉.然后重启数据库,于是乎各种问题来了 1 使用SYS 账号登录时报错:ORA-09817: Write to audit file failed 然后在使用df -h命令系统检查一下,发现Oracle安装目录所对应的磁盘空间已满,于是删除3天以前的trace文件,…
1.RDS 数据日志已经快满了, 导致数据库不能写入,只读. 2. Binlog日志的保存及清理规则 MySQL实例的空间内默认清理binlog日志的规则如下: 实例空间内默认会保存最近18个小时内的binlog文件. 当实例使用空间小于购买空间的90%时,系统会保存购买空间的30%的binlog(即使该binlog文件已经上传到OSS内). 当实例使用空间超过购买空间的90%时,binlog会在上传到OSS后,发起删除本地数据的请求,但本地删除会有任务调度,有一定延迟. 3.Binlog文件上…
因磁盘空间不足导致HDFS的NameNode进入安全模式问题记录,调用API上传及下载文件时报如下错误信息: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.SafeModeException): Cannot delete /null/daxt/0265803074a54d54b8ec0b91df359bdf.log. Name node is in safe mode. Resource…
故障现象 2016.1.1号早上4点左右,zabbi数据库服务器报警,写入数据失败.登陆机器后检查发现磁盘空间使用95%没有用满,进去zabbix数据库,执行insert命令提示错误“errir 1030(HY000):got error 28 from storage engine”.    前提 zabbix数据库由于超大的写入量,我们使用tokudb存储引擎来存储,此引擎有强大的压缩比,写入性能也非常不错,适合zabbix数据库场景.   故障调查 1)检查错误日志,发现有如下 Versi…
rabbitmq-server 启动问题 今天遇到一个挺奇怪的 rabbitmq-server 的启动问题. 在内部使用的 openstack 环境上,rabbitmq-server突然就关掉了,无法启动. 于是,尝试生动启动一下: rabbitmq-server 错误报告说是: Could not create dir /var/lib/rabbitmq/mnesia/rabbit@host-plugins-expand (enospc) 一开始以为是目录的权限问题,检查了一遍,确认目录所有权…
最近刚换了笔记本,拿到本后在win10基础装上Ubuntu 16.04双系统,有个问题是每次关机都会报一堆pcie问题,并且经常没声音,声音问题通过上一篇文章暂时解决,然后就没在意了,可是几天后出现系统盘根目录磁盘空间不够的提醒,于是用磁盘空间分析工具查看,/var/log/下kern.log 和syslog非常大,两个kern.log都接近10G,一个syslog也接近10G,三个点开都发现同样的问题,即pcie重复报错,信息如下: Jan :: zzf-ubuntu kernel: [ ::…
上周五去某客户那里做数据库巡检.是window 2008系统上10g的一套NC系统的库,已经配置了DG,可是巡检时发现数据库报错: Tue Nov 11 10:13:57 2014 LNS: Standby redo logfile selected for thread 1 sequence 3945 for destination LOG_ARCHIVE_DEST_2 Tue Nov 11 10:14:29 2014 Errors in file d:\oracle\product\10.2…
最初使用的阿里云云盘只有50G 正常运行的hadoop集群突然无法正常运行了,web页面显示节点为UNHEALTHY 使用df -m命令,发现一些节点磁盘空间占用达到了99%,因此要扩容磁盘空间 1.为云盘建立快照,以防出错 2.磁盘扩容 3.选择扩容容量,选在线扩容,付费 4.如果是centos7 此处以CentOS 7操作系统为例演示分区扩展的步骤. 运行fdisk -l命令查看现有云盘大小. 以下示例返回云盘(/dev/vda)容量是100GiB.   [root@ecshost ~]#…
在自动化测试过程中,测试报告最能直观的体现测试的价值,之前一直使用maven+junit来构建我的自动化测试,但这样有几个缺点,一是,不能定时构建自动化任务(也许是我没有找到maven有没有提供这样的方法),二是,不能生成一个直观的测试报告(maven+junit在surefire-reports文件目录下提供两种格式的测试结果集,一种是txt文本格式,第二种是junit的xml格式的,但给我总体感觉还是不够直观),三是,无法完成分布式执行测试,设想一下,如果我们有成千上百个testcase,我…
由于之前ESB是供应商部署的,且部署在C盘(C盘空间很小,还添加了很多ESB的windows服务日志在C盘,很容易把C盘空间占满,导致ESB服务运行宕机,几乎每隔几周发生一次事故,需要人工干预处理,不甚其烦), 因此前段时间对于基于RabbitMQ构建的ESB进行了综合优化,以确保ESB服务的稳定可靠,同时初步建立了自动化的ESB监控和运维体系,本文介绍一种其中用到技术之一,通过SSIS监控远程服务器磁盘空间并发送邮件报警,目的是当自动化ESB运维失效的时候,可以进行人工干预处理. 通过WMI可…
一则清理MySQL大表以释放磁盘空间的案例 一.基本情况: 1.dbtest库554G,先清理st_online_time_away_ds(37G)表的数据,保留半年的数据: 1)删除的数据:select count(1),tdate from dbtest.st_online_time_away_ds where tdate < '2017-08-01';(记录数为:462171894) 2)保留的数据:select count(1),tdate from dbtest.st_online_t…
摘要:用了 Docker,好处挺多的,但是有一个不大不小的问题,它会一不小心占用太多磁盘,这就意味着我们必须及时清理. 作为一个有信仰的技术公司,我们Fundebug的后台采用了酷炫的全 Docker 化架构,所有服务,包括数据库都运行在 Docker 里面.这样做当然不是为了炫技,看得清楚的好处还是不少的: 所有服务器的配置都非常简单,只安装了 Docker,这样新增服务器的时候要简单很多. 可以非常方便地在服务器之间移动各种服务,下载 Docker 镜像就可以运行,不需要手动配置运行环境.…
本文转载自https://blog.fundebug.com/2018/01/10/how-to-clean-docker-disk/ , 感谢原作者. 摘要:用了Docker,好处挺多的,但是有一个不大不小的问题,它会一不小心占用太多磁盘,这就意味着我们必须及时清理. 作为一个有信仰的技术公司,我们Fundebug的后台采用了酷炫的全Docker化架构,所有服务,包括数据库都运行在Docker里面.这样做当然不是为了炫技,看得清楚的好处还是不少的: 所有服务器的配置都非常简单,只安装了Dock…
前言:早晨磁盘报警刚清空完tomcat和nginx日志,使用的命令是类似echo "" > show_web-error.log或者> show_web-debug.log清空语句,然后rm -rf 掉一些tar.gz包,空出来30G空间.而且也关闭了tomcat的debug信息.刚刚又接到报警,磁盘100%了.怎么回事?​1,进去df -h下,确实100%了,如下所示:[root@localhost ~]# df -h文件系统              容量  已用 可用…
Linux系统中需要监控磁盘各分区的使用情况,避免由于各种突发情况,造成磁盘空间被消耗殆尽的情况,例如某个分区被Oracle的归档日志耗尽,导致后续的日志文件无法归档,这时ORACLE数据库就会出现错误.监控磁盘空间的使用情况,其实有许多工具,例如Nagios等,其实最简单的还是使用Shell脚本.下面就介绍一下如何通过Shell脚本和Crontab作业结合来实现对磁盘空间的监控.告警. 一般查看磁盘各分区的使用情况可以通过df命令来查看,网上有两种获取磁盘使用百分比的Shell脚本. 1:df…