本文根据MOS文章:Oracle Exadata Database Machine EXAchk (Doc ID 1070954.1)整理关键步骤。

注:通常都会要求使用当前最新可用的EXAchk版本进行健康检查。

1.查看当前版本

因为Exachk 现在是自治运行状况框架 (AHF) 和跟踪文件分析器 (TFA) 的组成部分。安装 AHF 的当前版本,即可获取最新的 Exachk 和 TFA 版本。
所以既可以通过tfactl查看版本信息,也可以单独查看:

tfactl version -all
exachk -v

若查询结果不匹配最新,则下载最新可用的 Exachk 版本,进行版本更新。反之就可以直接进行第三步巡检信息采集。

要查找 AHF/Exachk 文件结构的根目录,请执行以下命令:

# cat /etc/oracle.ahf.loc
/opt/oracle.ahf

此外,如果完整的 AHF 安装成功,则 Exachk 应安排每天 02:00 执行 exatier1 配置文件。您可以使用以下命令验证自动运行配置:

# exachk -get all -id autostart_client_exatier1

2.执行版本更新

下载最新可用版本,在上面提到的MOS文章中有下载链接。当前最新可用版本是:v20.4。然后解压:

# unzip AHF-LINUX_v20.4.0.zip
Archive: AHF-LINUX_v20.4.0.zip
inflating: README.txt
inflating: ahf_setup

更新版本:

# ./ahf_setup -ahf_loc /opt -data_dir <ORACLE_BASE of Grid owner>
# ./ahf_setup -ahf_loc /opt -data_dir /u01/app/grid

实际执行如下:

[root@dbm08dbadm01 ~]# ./ahf_setup -ahf_loc /opt -data_dir /u01/app/grid

AHF Installer for Platform Linux Architecture x86_64

AHF Installation Log : /tmp/ahf_install_204000_252391_2021_02_02-15_08_40.log

Starting Autonomous Health Framework (AHF) Installation

AHF Version: 20.4.0 Build Date: 202012141017

AHF is already installed at /opt/oracle.ahf

Installed AHF Version: 20.2.3 Build Date: 202010121848

Do you want to upgrade AHF [Y]|N : y

AHF will also be installed/upgraded on these Cluster Nodes :

1. dbm08dbadm02

The AHF Location and AHF Data Directory must exist on the above nodes
AHF Location : /opt/oracle.ahf
AHF Data Directory : /u01/app/grid/oracle.ahf/data Do you want to install/upgrade AHF on Cluster Nodes ? [Y]|N : y Upgrading /opt/oracle.ahf Shutting down AHF Services
Shutting down TFA
Removed symlink /etc/systemd/system/graphical.target.wants/oracle-tfa.service.
Removed symlink /etc/systemd/system/multi-user.target.wants/oracle-tfa.service.
. . . . .
. . .
Successfully shutdown TFA.. Starting AHF Services
Starting TFA..
Created symlink from /etc/systemd/system/multi-user.target.wants/oracle-tfa.service to /etc/systemd/system/oracle-tfa.service.
Created symlink from /etc/systemd/system/graphical.target.wants/oracle-tfa.service to /etc/systemd/system/oracle-tfa.service.
Waiting up to 100 seconds for TFA to be started..
. . . . .
Successfully started TFA Process..
. . . . .
TFA Started and listening for commands
No new directories were added to TFA INFO: Starting exachk scheduler in background. Details for the process can be found at /u01/app/grid/oracle.ahf/data/dbm08dbadm01/diag/exachk/compliance_start_020221_151142.log AHF upgrade completed on dbm08dbadm01 Upgrading AHF on Remote Nodes : AHF will be installed on dbm08dbadm02, Please wait. Please Enter the password for dbm08dbadm02 : Is password same for all the nodes? [Y]|N : y Upgrading AHF on dbm08dbadm02 : [dbm08dbadm02] Copying AHF Installer [dbm08dbadm02] Running AHF Installer AHF is sucessfully upgraded to latest version .--------------------------------------------------------------------.
| Host | TFA Version | TFA Build ID | Upgrade Status |
+--------------+-------------+----------------------+----------------+
| dbm08dbadm01 | 20.4.0.0.0 | 20400020201214101756 | UPGRADED |
| dbm08dbadm02 | 20.4.0.0.0 | 20400020201214101756 | UPGRADED |
'--------------+-------------+----------------------+----------------' Moving /tmp/ahf_install_204000_252391_2021_02_02-15_08_40.log to /u01/app/grid/oracle.ahf/data/dbm08dbadm01/diag/ahf/ [root@dbm08dbadm01 ~]#

再次查询版本确认更新成功:

[root@dbm08dbadm01 ~]# exachk -v
EXACHK VERSION: 20.4.0_20201214 [root@dbm08dbadm01 ~]# tfactl version -all
TFA Version : 204000
TFA Build ID : 20201214101756
TFA Build Label : TFA_MAIN_GENERIC_201213.1900 EXACHK VERSION: 20.4.0_20201214 AHF VERSION: 20.4.0

3.执行exachk巡检

使用最新版本的exachk进行巡检:

[root@dbm08dbadm01 ~]# which exachk
/usr/bin/exachk
[root@dbm08dbadm01 ~]# exachk
..
UPLOAD [if required] - /u01/app/grid/oracle.ahf/data/dbm08dbadm01/exachk/user_root/output/exachk_dbm08dbadm01_cdb1db1_020221_15276.zip

根据交互提示输入对应的数据库信息、如果没有配置互信,还需要输入CELL节点、交换机的密码等信息,完成采集后下载压缩包到本机查看结果,重点关注critical类问题。

Exadata健康检查工具EXAchk的更多相关文章

  1. HBase 健康检查工具

    在HBase运维中 最常用的工具就是hbck. 查看整个集群的表状况.如果region很多,建议慎重使用,会比较慢,而采用(3). (1)hbase  hbck 详细显示集群状况. (2)hbase ...

  2. 【RDA】使用RDA(Remote Diagnostic Agent)工具对数据库进行健康检查

    [RDA]使用RDA(Remote Diagnostic Agent)工具对数据库进行健康检查 分类: Linux RDA英文全称叫做"Oracle Remote Diagnostic Ag ...

  3. keepalived健康检查方式

    keepalived对后端realserver的健康检查方式主要有以下几种: TCP_CHECK:工作在第4层,keepalived向后端服务器发起一个tcp连接请求,如果后端服务器没有响应或超时,那 ...

  4. Oracle SQL 调优健康检查脚本

    Oracle SQL 调优健康检查脚本 我们关注数据库系统的性能,进行数据库调优的主要工作就是进行SQL的优化.良好的数据架构设计.配合应用系统中间件和写一手漂亮的SQL,是未来系统上线后不出现致命性 ...

  5. ASP.NET Core之跨平台的实时性能监控(2.健康检查)

    前言 上篇我们讲了如何使用App Metrics 做一个简单的APM监控,最后提到过健康检查这个东西. 这篇主要就是讲解健康检查的内容. 没看过上篇的,请移步:ASP.NET Core之跨平台的实时性 ...

  6. Docker+Jenkins持续集成环境(3)集成PMD、FindBugs、Checkstyle静态代码检查工具并邮件发送检查结果

    为了规范代码,我们一般会集成静态代码检测工具,比如PMD.FindBugs.Checkstyle,那么Jenkins如何集成这些检查工具,并把检查结果放到构建邮件里呢? 今天做了调研和实现,过程如下 ...

  7. LVS节点健康检查及管理脚本

    在LVS负载均衡主节点上,模拟keepalived健康检查功能管理LVS节点,当节点挂掉从服务器池中剔除,好了再加到服务器池中来. 工具:yum install -y ipvsadm web03:10 ...

  8. keepalive的工作原理和如何做到健康检查

    keepalived是以VRRP协议为实现基础的,VRRP全称Virtual Router Redundancy Protocol,即虚拟路由冗余协议. 虚拟路由冗余协议,可以认为是实现路由器高可用的 ...

  9. ORAchk-数据库健康检查好帮手

    ORAchk 之前被称为RACcheck,后来它的检查范围进行了扩展,改名为了ORAchk,它是在数据库系统进行健康检查的一个专用工具,这个工具主要用来检查软件的配置是否符合要求以及一些最佳实践是否被 ...

  10. 健康检查NET Core之跨平台的实时性能监控

    ASP.NET Core之跨平台的实时性能监控(2.健康检查)   前言 上篇我们讲了如何使用App Metrics 做一个简单的APM监控,最后提到过健康检查这个东西. 这篇主要就是讲解健康检查的内 ...

随机推荐

  1. Spring的@Async使用防坑

    很多人会直接只用@Async来执行异步操作.但是这里面有一个问题,如果都是用spring的默认实现,是有坑的. 当我们开启 EnableAsync 只有就使用Async来执行异步操作了. 走JDK的动 ...

  2. C#开源跨平台的多功能Steam工具箱&GitHub加速神器

    前言 作为一个程序员你是否会经常会遇到GitHub无法访问(如下无法访问图片),或者是访问和下载源码时十分缓慢就像乌龟爬行一般.今天分享一款C#开源的.跨平台的多功能Steam工具箱和GitHub加速 ...

  3. java进阶(32)--Collections工具类

    一.简介:Collection与Collections区别 1.Java.until.Collection是集合接口 2.Java.until.Collections是集合工具类,方便集合的操作 二. ...

  4. python常见面试题讲解(五)质数因子

    题目描述 功能:输入一个正整数,按照从小到大的顺序输出它的所有质因子(重复的也要列举)(如180的质因子为2 2 3 3 5 ) 最后一个数后面也要有空格 输入描述: 输入一个long型整数 输出描述 ...

  5. Go-使用本地时间解析时间字符串

    字符串 ==> time.Time package main import ( "fmt" "log" "time" ) func m ...

  6. Shell-获取终端输入-read

  7. [转帖]005、体系结构之TiKV_Raft日志

    Raft日志 1.Raft与Multi Raft 2.Raft 日志复制 2.1.复制流程总览 2.2.Propose 2.3.Append 2.3.Replicate(Append) 2.4 Com ...

  8. Linux 开启防火墙 避免非干系人误操作的处理

    公司里面进行系统集成测试. 不想让开发能够更改我的服务器信息, 但是改密码又太麻烦了. 想了想还是用 防火墙好一些. 第一步 开启防火墙 systemctl enable firewalld syst ...

  9. Linux应用程序下网络栈参数的简单整理

    somaxconn 该参数应该是决定一个服务能够同时处理多少个网络请求的核心参数. 一个程序能够支持多少个访问参数,是有两部分来决定, 第一部分是somaxconn ,第二部分是应用服务器启动时传递过 ...

  10. js 删除数组中的某一个内容

    <script type="text/javascript"> let list=["为","啊发大水","阿斯蒂芬& ...