Exadata健康检查工具EXAchk
本文根据MOS文章:Oracle Exadata Database Machine EXAchk (Doc ID 1070954.1)整理关键步骤。
注:通常都会要求使用当前最新可用的EXAchk版本进行健康检查。
1.查看当前版本
因为Exachk 现在是自治运行状况框架 (AHF) 和跟踪文件分析器 (TFA) 的组成部分。安装 AHF 的当前版本,即可获取最新的 Exachk 和 TFA 版本。
所以既可以通过tfactl查看版本信息,也可以单独查看:
tfactl version -all
exachk -v
若查询结果不匹配最新,则下载最新可用的 Exachk 版本,进行版本更新。反之就可以直接进行第三步巡检信息采集。
要查找 AHF/Exachk 文件结构的根目录,请执行以下命令:
# cat /etc/oracle.ahf.loc
/opt/oracle.ahf
此外,如果完整的 AHF 安装成功,则 Exachk 应安排每天 02:00 执行 exatier1 配置文件。您可以使用以下命令验证自动运行配置:
# exachk -get all -id autostart_client_exatier1
2.执行版本更新
下载最新可用版本,在上面提到的MOS文章中有下载链接。当前最新可用版本是:v20.4。然后解压:
# unzip AHF-LINUX_v20.4.0.zip
Archive: AHF-LINUX_v20.4.0.zip
inflating: README.txt
inflating: ahf_setup
更新版本:
# ./ahf_setup -ahf_loc /opt -data_dir <ORACLE_BASE of Grid owner>
# ./ahf_setup -ahf_loc /opt -data_dir /u01/app/grid
实际执行如下:
[root@dbm08dbadm01 ~]# ./ahf_setup -ahf_loc /opt -data_dir /u01/app/grid
AHF Installer for Platform Linux Architecture x86_64
AHF Installation Log : /tmp/ahf_install_204000_252391_2021_02_02-15_08_40.log
Starting Autonomous Health Framework (AHF) Installation
AHF Version: 20.4.0 Build Date: 202012141017
AHF is already installed at /opt/oracle.ahf
Installed AHF Version: 20.2.3 Build Date: 202010121848
Do you want to upgrade AHF [Y]|N : y
AHF will also be installed/upgraded on these Cluster Nodes :
1. dbm08dbadm02
The AHF Location and AHF Data Directory must exist on the above nodes
AHF Location : /opt/oracle.ahf
AHF Data Directory : /u01/app/grid/oracle.ahf/data
Do you want to install/upgrade AHF on Cluster Nodes ? [Y]|N : y
Upgrading /opt/oracle.ahf
Shutting down AHF Services
Shutting down TFA
Removed symlink /etc/systemd/system/graphical.target.wants/oracle-tfa.service.
Removed symlink /etc/systemd/system/multi-user.target.wants/oracle-tfa.service.
. . . . .
. . .
Successfully shutdown TFA..
Starting AHF Services
Starting TFA..
Created symlink from /etc/systemd/system/multi-user.target.wants/oracle-tfa.service to /etc/systemd/system/oracle-tfa.service.
Created symlink from /etc/systemd/system/graphical.target.wants/oracle-tfa.service to /etc/systemd/system/oracle-tfa.service.
Waiting up to 100 seconds for TFA to be started..
. . . . .
Successfully started TFA Process..
. . . . .
TFA Started and listening for commands
No new directories were added to TFA
INFO: Starting exachk scheduler in background. Details for the process can be found at /u01/app/grid/oracle.ahf/data/dbm08dbadm01/diag/exachk/compliance_start_020221_151142.log
AHF upgrade completed on dbm08dbadm01
Upgrading AHF on Remote Nodes :
AHF will be installed on dbm08dbadm02, Please wait.
Please Enter the password for dbm08dbadm02 :
Is password same for all the nodes? [Y]|N : y
Upgrading AHF on dbm08dbadm02 :
[dbm08dbadm02] Copying AHF Installer
[dbm08dbadm02] Running AHF Installer
AHF is sucessfully upgraded to latest version
.--------------------------------------------------------------------.
| Host | TFA Version | TFA Build ID | Upgrade Status |
+--------------+-------------+----------------------+----------------+
| dbm08dbadm01 | 20.4.0.0.0 | 20400020201214101756 | UPGRADED |
| dbm08dbadm02 | 20.4.0.0.0 | 20400020201214101756 | UPGRADED |
'--------------+-------------+----------------------+----------------'
Moving /tmp/ahf_install_204000_252391_2021_02_02-15_08_40.log to /u01/app/grid/oracle.ahf/data/dbm08dbadm01/diag/ahf/
[root@dbm08dbadm01 ~]#
再次查询版本确认更新成功:
[root@dbm08dbadm01 ~]# exachk -v
EXACHK VERSION: 20.4.0_20201214
[root@dbm08dbadm01 ~]# tfactl version -all
TFA Version : 204000
TFA Build ID : 20201214101756
TFA Build Label : TFA_MAIN_GENERIC_201213.1900
EXACHK VERSION: 20.4.0_20201214
AHF VERSION: 20.4.0
3.执行exachk巡检
使用最新版本的exachk进行巡检:
[root@dbm08dbadm01 ~]# which exachk
/usr/bin/exachk
[root@dbm08dbadm01 ~]# exachk
..
UPLOAD [if required] - /u01/app/grid/oracle.ahf/data/dbm08dbadm01/exachk/user_root/output/exachk_dbm08dbadm01_cdb1db1_020221_15276.zip
根据交互提示输入对应的数据库信息、如果没有配置互信,还需要输入CELL节点、交换机的密码等信息,完成采集后下载压缩包到本机查看结果,重点关注critical类问题。
Exadata健康检查工具EXAchk的更多相关文章
- HBase 健康检查工具
在HBase运维中 最常用的工具就是hbck. 查看整个集群的表状况.如果region很多,建议慎重使用,会比较慢,而采用(3). (1)hbase hbck 详细显示集群状况. (2)hbase ...
- 【RDA】使用RDA(Remote Diagnostic Agent)工具对数据库进行健康检查
[RDA]使用RDA(Remote Diagnostic Agent)工具对数据库进行健康检查 分类: Linux RDA英文全称叫做"Oracle Remote Diagnostic Ag ...
- keepalived健康检查方式
keepalived对后端realserver的健康检查方式主要有以下几种: TCP_CHECK:工作在第4层,keepalived向后端服务器发起一个tcp连接请求,如果后端服务器没有响应或超时,那 ...
- Oracle SQL 调优健康检查脚本
Oracle SQL 调优健康检查脚本 我们关注数据库系统的性能,进行数据库调优的主要工作就是进行SQL的优化.良好的数据架构设计.配合应用系统中间件和写一手漂亮的SQL,是未来系统上线后不出现致命性 ...
- ASP.NET Core之跨平台的实时性能监控(2.健康检查)
前言 上篇我们讲了如何使用App Metrics 做一个简单的APM监控,最后提到过健康检查这个东西. 这篇主要就是讲解健康检查的内容. 没看过上篇的,请移步:ASP.NET Core之跨平台的实时性 ...
- Docker+Jenkins持续集成环境(3)集成PMD、FindBugs、Checkstyle静态代码检查工具并邮件发送检查结果
为了规范代码,我们一般会集成静态代码检测工具,比如PMD.FindBugs.Checkstyle,那么Jenkins如何集成这些检查工具,并把检查结果放到构建邮件里呢? 今天做了调研和实现,过程如下 ...
- LVS节点健康检查及管理脚本
在LVS负载均衡主节点上,模拟keepalived健康检查功能管理LVS节点,当节点挂掉从服务器池中剔除,好了再加到服务器池中来. 工具:yum install -y ipvsadm web03:10 ...
- keepalive的工作原理和如何做到健康检查
keepalived是以VRRP协议为实现基础的,VRRP全称Virtual Router Redundancy Protocol,即虚拟路由冗余协议. 虚拟路由冗余协议,可以认为是实现路由器高可用的 ...
- ORAchk-数据库健康检查好帮手
ORAchk 之前被称为RACcheck,后来它的检查范围进行了扩展,改名为了ORAchk,它是在数据库系统进行健康检查的一个专用工具,这个工具主要用来检查软件的配置是否符合要求以及一些最佳实践是否被 ...
- 健康检查NET Core之跨平台的实时性能监控
ASP.NET Core之跨平台的实时性能监控(2.健康检查) 前言 上篇我们讲了如何使用App Metrics 做一个简单的APM监控,最后提到过健康检查这个东西. 这篇主要就是讲解健康检查的内 ...
随机推荐
- node开发概述
一.Node开发概述 1. 为什么要学习服务器端开发 能够与后端程序员更加紧密的配合 网站业务逻辑前置,学习前端技术需要后端技术支撑(ajax) 扩宽知识视野,能够站在更高的角度审视整个项目 2. 服 ...
- Python实现PowerPoint(PPT/PPTX)到PDF的批量转换
如果需要处理大量的PPT转PDF的工作,一个个打开并另存为PDF是非常费时的做法.我们可以利用Python编程语言的强大的工具来自动化这个过程,使得批量转换变得简单而高效.本文将介绍如何使用Pytho ...
- C# 几种常见数据结构(数组、链表、Hash表)
一.内存上连续存储,节约空间,可以索引访问,读取快,增删慢 Array: 在内存上连续分配的,而且元素类型是一样的,可以坐标访问;读取快--增删慢,长度不变 { //Array:在内存上连续分配的,而 ...
- MyBatis 系列:MyBatis 源码环境搭建
目录 一.环境准备 二.下载 MyBatis 源码和 MyBatis-Parent 源码 三.创建空项目.导入项目 四.编译 mybatis-parent 五.编译 mybatis 六.测试 总结 一 ...
- @EnableFeignClients注解源码解析
转载请注明出处: @EnableFeignClients 注解定义的源码 @Retention(RetentionPolicy.RUNTIME) @Target({ElementType.TYPE}) ...
- 【C/C++】 开发必备知识总结
>from: C/C++ 开发必备知识总结 (qq.com) const 作用 修饰变量,说明该变量不可以被改变: 修饰指针,分为指向常量的指针和指针常量: 常量引用,经常用于形参类型,即避免了 ...
- [转帖]Mnesia reports that this RabbitMQ cluster has experienced a network partition.
一 问题描述 双节点RabbitMQ集群发生了脑裂,节点日志报错: [error] <0.6318.0> Mnesia(rabbit@pc2): ** ERROR ** mnesia_ev ...
- [转帖]RHEL/CentOS 7中的网络暨network.service与NetworkManager.service详解
在RHEL/CentOS 6及以前的版本中,网络功能是通过一系列网络相关的脚本文件实现,如/etc/init.d/network文件,及如下/sbin/if*文件等. [root@myserver ~ ...
- [转帖]Kafka 核心技术与实战学习笔记(六)kafka线上集群部署方案
一.操作系统-Linux Kafka是JVM系的大数据框架 kafka由Scala语言和Java语言编写而成,编译之后的源代码就是普通的".class"文件 使用Linux kaf ...
- [转帖]Intel固态硬盘总结
https://www.cnblogs.com/hongdada/p/17326247.html 2012年推出的S3700,采用的是25nm闪存颗粒. 2015年推出s3710,采用的是20nm闪存 ...