小知识：TFA收集日志报错空间不足

今天在某客户环境下分析某节点驱逐的故障，发现有安装TFA，所以使用一键收集包含故障时刻的日志

tfactl diagcollect -from "2020-08-14 03:00:00" -to "2020-08-14 05:00:00" -all

结果收集日志时报错空间不足：

Not enough space in Repository or TFA_BASE to run collections

实际df查看对应目录的空间充足，这实际上是受限TFA repository的Maximum Size (MB) 设置，默认一般是10GB，客户的环境由于保存osw时间过长，导致已超出这个大小，进而使收集日志报错空间不足。

根据MOS文档：TFA Diagcollection Reports "Not enough space in Repository or TFA_BASE to run collections" (Doc ID 2300038.1)

有明确的解决方案：

tfactl set reposizeMB=10240

tfactl print repository

Notably, The repository location can be changed using tfactl set repositorydir=

根据MOS的方案，我们查看当前值，结合实际情况设置为合适的值，注意需要使用root用户操作:

tfactl print repository

tfactl set reposizeMB=20480

甚至在极端场景下，目录空间不够，可以设置其他有空间剩余的目录：

mkdir /tmp/repository

tfactl set repositorydir=/tmp/repository

再次尝试TFA快速收集相关日志：

tfactl diagcollect -from "2020-08-14 03:00:00" -to "2020-08-14 05:00:00" -all

可以成功收集所需日志：

[root@db01 grid]# tfactl diagcollect -from "2020-08-14 03:00:00" -to "2020-08-14 05:00:00" -all

The -all switch is being deprecated as collection of all components is the default behavior. TFA will continue to collect all components.

Collecting data for all nodes

Scanning files from aug/14/2020 03:00:00 to aug/14/2020 05:00:00

Collection Id : 20200814235440db01

Detailed Logging at : /tmp/repository/collection_Fri_Aug_14_23_54_41_CST_2020_node_all/diagcollect_20200814235440_db01.log

2020/08/14 23:54:51 CST : NOTE : Any file or directory name containing the string .com will be renamed to replace .com with dotcom

2020/08/14 23:54:51 CST : Collection Name : tfa_Fri_Aug_14_23_54_41_CST_2020.zip

2020/08/14 23:54:51 CST : Collecting diagnostics from hosts : [db01, db02]

2020/08/14 23:54:52 CST : Scanning of files for Collection in progress...

2020/08/14 23:54:52 CST : Collecting additional diagnostic information...

2020/08/14 23:55:37 CST : Getting list of files satisfying time range [08/14/2020 03:00:00 CST, 08/14/2020 05:00:00 CST]

2020/08/14 23:55:50 CST : Collecting ADR incident files...

2020/08/14 23:56:49 CST : Completed collection of additional diagnostic information...

2020/08/14 23:56:50 CST : Completed Local Collection

2020/08/14 23:56:50 CST : Remote Collection in Progress...

.---------------------------------.

|        Collection Summary       |

+------+-----------+-------+------+

| Host | Status    | Size  | Time |

+------+-----------+-------+------+

| db02 | Completed | 803kB | 128s |

| db01 | Completed | 1.2MB | 118s |

'------+-----------+-------+------'

Logs are being collected to: /tmp/repository/collection_Fri_Aug_14_23_54_41_CST_2020_node_all

/tmp/repository/collection_Fri_Aug_14_23_54_41_CST_2020_node_all/db01.tfa_Fri_Aug_14_23_54_41_CST_2020.zip

/tmp/repository/collection_Fri_Aug_14_23_54_41_CST_2020_node_all/db02.tfa_Fri_Aug_14_23_54_41_CST_2020.zip

我这里是测试环境演示，没什么太多信息所以日志比较小，实际生产环境，这个压缩文件一般会大一些。

小知识：TFA收集日志报错空间不足的更多相关文章

【zabbix监控问题】记录zabbix控制面板报错及日志报错的解决方法
问题1: 上图是我已经解决了的截图.在百度查询的资料中,说是把zabbix_agentd.conf文件中server监听的主机127.0.0.1去掉,但是我去掉之后问题仍然没有解决,最后在这篇博客上发 ...
11gR2数据库日志报错：Fatal NI connect error 12170、
11gR2数据库日志报错:Fatal NI connect error 12170.TNS-12535.TNS-00505 [问题点数:100分,结帖人MarkIII] 不显示 ...
zabbix客户端日志报错no active checks on server [192.168.3.108:10051]: host [192.168.3.108] not found
zabbix客户端日志报错: 45647:20160808:220507.717 no active checks on server [192.168.3.108:10051]: host [192 ...
记一次rsync日志报错directory has vanished
中午两点的时候邮件告知rsync同部svn源库失败,看rsync日志报错显示如上,当时还在上课,没在公司,怀疑是不是有人动了svn的版本库,后来询问同事并通过vpn登录服务器上查看版本库是正常的,也没 ...
【docker】【redis】2.docker上设置redis集群---Redis Cluster部署【集群服务】【解决在docker中redis启动后，状态为Restarting，日志报错：Configured to not listen anywhere, exiting.问题】【Waiting for the cluster to join...问题】
参考地址:https://www.cnblogs.com/zhoujinyi/p/6477133.html https://www.cnblogs.com/cxbhakim/p/9151720.htm ...
mpvue开发微信小程序，分享按钮报错：`Cannot read property 'apply' of null`
用mpvue开发微信小程序,分享按钮报错:Cannot read property 'apply' of null onShareAppMessage 是于微信小程序Pages的生命周期钩子,顾这个方 ...
AppiumLibrary库倒入后显示红色，日志报错：ImportError: cannot import name 'InvalidArgumentException'
AppiumLibrary安装后,robotframe worke 倒入后一直显示红色,查看日志报错:ImportError: cannot import name 'InvalidArgumentE ...
gazebo仿真踩坑--rviz中设定机器人的目标位置，move_base后台日志报错
启动仿真环境及各种节点(amcl,move_base,map_server)后,在rviz中设定机器人的目标位置,后台日志报错 [ INFO] [1571974242.864525935, 40.51 ...
mysqlbinlog查看 binlog日志报错mysqlbinlog: unknown variable 'default-character-set=utf8mb4'
今天,查看mysql slave节点 binlog日志信息时,执行mysqlbinlog命令报错mysqlbinlog: unknown variable 'default-character-set ...
postgresql 日志报错could not write to log file: No space left on device，could not write lock file "postmaster.pid": No space left on device
今天遇到了一个特别奇怪的问题,我在用docker容器的时候,发现我的postgresql怎么也启动不起来尝试了N多种办法,最后看了看postgresql的日志发现 postgresql 日志中报错 ...

随机推荐

对话开发者：Serverless 落地的困境与破局
作者 | 阿里云开发者社区.InfoQ 从 2012 年提出 Serverless 到今年 2022 年刚好十年. 过去十年,上云是确定性趋势,在这个阶段企业一开始的关注点在于如何实现平滑上云.随着越 ...
mouseenter和mouseover区别
mouseenter事件当鼠标移动到元素上时,就会触发mouseenter事件. 类似mouseover,它们两者之间的差别是:mouseover鼠标经过自身盒子会触发,经过子盒子还会触发.mous ...
C#设计模式02——原型模式的写法
public class ProteType { private static ProteType _ProteType = new ProteType(); private ProteType() ...
C++ 利用模板偏特化和 decltype(()) 识别表达式的值类别
刚刚看到一篇 C++ 博客,里面讲到用模板偏特化和 decltype() 识别值类别:lvalue glvalue xvalue rvalue prvalue.依照博客的方法试了一下,发现根本行不通. ...
理解 docker volume
1. docker volume 简介文章介绍了 docker image,它由一系列只读层构成,通过 docker image 可以提高镜像构建,存储和分发的效率,节省时间和存储空间.然而 do ...
spring-transaction源码分析(1)概述和事务传播级别
spring-tx概述 spring-tx包使用注解驱动和AOP通知将事务开启.提交/回滚.以及复杂的传播机制封装了起来,开发者不再需要编写事务管理的代码,而是可以只关注自己的业务逻辑. 本文将简单介 ...
Keep English Level-02
change -- n 零钱 climate change -- 气候变化 exchange -- 交换,兑换(金融) exchange rate -- 汇率 move -- 感动,改变,移动 (n) ...
【MLA】一种内存泄漏分析方法
项目地址:skullboyer/MLA (github.com) 介绍 MLA 即 Memory Leak Analyzer,是一个排查内存泄漏的分析器实现机制是在malloc时记录分配位置信息,在 ...
让vs自动提示没有using的类
默认情况下,没有using的类,敲代码时没有智能提示,需要在[工具]->[选项]中开启
idb单副本时-TiKV节点损坏后有损数据恢复的方法
Tidb单副本时-TiKV节点损坏后有损数据恢复的方法背景 UAT环境下,为了减少存储. 搭建了一套单副本的TiDB集群但是随着数据量的增多, UAT上面的数据可以丢失,但是表结构等信息是无法接受 ...

小知识：TFA收集日志报错空间不足

小知识：TFA收集日志报错空间不足的更多相关文章

随机推荐

热门专题