问题现象

客户在麒麟kylin v10 sp1环境上部署YashanDB,运行正常, 但是在巡检中发现run.log中有大量错误日志文件metadata changed,需要排查原因

问题单:前置机大量错误日志文件metadata changed,需要排查原因

问题的风险及影响

客户环境为准生产环境,担心影响业务执行。

问题影响的版本

YashanDB版本:22.2.11.100

问题发生原因

YashanDB利用操作系统linotify相关接口做文件设备的监控,范围是:数据文件、redo文件、控制文件、归档日志。

inotify_add_watch() 函数在部分麒麟(kylin v10 sp1)环境上执行结果和CentOS等其他环境不一致,在文件正常的情况下会返回大量的属性变更事件,导致大量错误日志,新版本(22.2.13.100之后)做了防洪规避,避免日志过多掩盖其他信息。

解决方法及规避方式

1、检查相应文件是否有异常。

2、升级到22.2.13.100之后版本。

问题分析和处理过程

检查参数DIAG_ADR_ENABLED,值为TRUE

该参数开启会启动HEATH_MONITOR线程, 做健康检查:

分析日志产生的原因

inotify_add_watch() 是 Linux 系统编程中用于监控文件系统事件的一个系统调用函数,它属于 inotify(Input/Output Notifier)接口的一部分。inotify 是 Linux 内核提供的一种高效、实时的文件系统事件监控机制,允许用户空间程序监控文件或目录的各种变化,如文件创建、删除、修改、移动等。

使用 inotify_add_watch() 监视某个文件或目录,并接收到属性变更(IN_ATTRIB)事件,但查看文件权限时并未发现明显的变化,可能有以下几种情况:

1、隐式属性变更:除了明显的权限(如读、写、执行)变更外,文件属性还包括其他一些可能被修改的元数据,如文件的拥有者、所属组、修改时间、访问时间、扩展属性(xattrs)等。这些属性的变更也可能触发 IN_ATTRIB 事件。请检查这些元数据是否发生了变化。

2、文件系统内部操作:有时,文件系统或底层存储设备可能会进行内部维护操作,如元数据刷新、缓存同步等,这些操作可能导致文件属性看似未变但实际上发生了内部变更,从而触发 IN_ATTRIB 事件。这种情况通常难以从用户层面察觉,但确实会导致事件通知。

3、文件系统挂载选项:如果文件系统是以特定挂载选项挂载的,某些属性变更可能不会立即反映到用户空间。例如,某些网络文件系统(如 NFS)或加密文件系统可能具有缓存属性或延迟写入特性。在这种情况下,虽然内核已经感知到属性变更并触发了 IN_ATTRIB 事件,但在用户空间观察时可能尚未看到变化。您可以尝试刷新文件系统缓存(如使用 sync 或 fsync),或者等待一段时间看属性是否会最终更新。

4、软件或服务干预:某些软件或服务(如备份工具、文件同步服务、权限管理工具等)可能在后台默默地修改文件属性,导致 IN_ATTRIB 事件的发生。检查是否有此类软件或服务正在运行,并确认它们是否可能影响到您监视的文件或目录。

5、编程错误或工具误报:如果您使用的是自编写的代码或第三方工具来检查文件权限,可能存在编程错误或工具本身的误报问题。请确保检查代码逻辑的正确性,或者使用可靠的命令行工具(如 ls -l 或 stat)来验证权限是否确实未变。

6、并发修改:如果多个进程或线程同时对文件进行操作,可能导致属性变更事件与您观察到的权限状态之间存在时间差。确保在接收到事件通知后立即检查权限,以减少并发修改带来的影响。

如果文件属性发生变化, 会触发IN_ATTRIB事件,输出错误日志

inotify_add_watch() 函数在部分麒麟(kylin v10 sp1)环境上执行结果和CentOS等其他环境不一致,在文件正常的情况下会返回大量的属性变更事件,导致大量错误日志。

检查数据库正常,该错误信息可忽略

客户确认数据库运行正常,inotify_add_watch是内核函数,其返回结果和其他系统不一致,新版本做了防洪规避,避免日志过多掩盖其他信息,可升级到新版本。

经验总结

1、YashanDB利用操作系统linotify相关接口做文件设备的监控,范围是:数据文件、redo文件、控制文件、归档日志。

2、inotify_add_watch() 函数在部分麒麟(kylin v10 sp1)环境上执行结果和CentOS等其他环境不一致,在文件正常的情况下会返回大量的属性变更事件,导致大量错误日志,新版本(22.2.13.100之后)做了防洪规避,避免日志过多掩盖其他信息。

【YashanDB数据库】数据库运行正常,日志出现大量错误metadata changed的更多相关文章

  1. 传递给数据库 'master' 中的日志扫描操作的日志扫描号无效

    错误:连接数据库的时候提示:SQL Server 检测到基于一致性的逻辑 I/O 错误 校验和不正确 C:\Documents and Settings\Administrator>" ...

  2. 你真的了解 MySQL 数据库的运行状况吗?

    2015年第三方市场调查机构 Evans 数据公司最近公布的一系列客户调查数据显示,在过去两年里,MySQL 在所有开发者使用的数据库中获得了25%的市场份额,Evans 公司的本次调查显示,数据库的 ...

  3. sqlserver服务启动后停止,传递给数据库 'master' 中的日志扫描操作的日志扫描号无效

    电脑异常重启,导致SqlServer服务启动后,自动停止,在[计算机管理]-[事件查看器]-[windows日志]中进行查看系统错误日志,在[应用程序]下发现可能的错误信息有以下两条: 1.错误:传递 ...

  4. 使用SQL语句创建数据库1——创建一个数据库文件和一个日志文件的数据库

    目的:创建一个数据库文件和一个日志文件的数据库 在matser数据库下新建查询,输入的命令如下: USE master——指向当前使用的数据库.创建数据库实际上是向master数据库中增加一条数据库信 ...

  5. Mysql数据库的用户和日志管理

    Mysql数据库的用户和日志管理 数据库的用户管理 1.mysql用户账号管理 用户账号 user@host user:账户名称 host:此账户可通过哪些客户端主机请求创建连接线程,可以是ip.主机 ...

  6. 数据库 'tempdb' 的事务日志已满。若要查明无法重用日志中的空间的原因

    最常的做法: --1.清空日志 DUMP TRANSACTION tempdb WITH NO_LOG --2.截断事务日志: BACKUP LOG tempdb WITH NO_LOG --3.收缩 ...

  7. 数据库tempdb的事物日志已满,原因为“ACTIVE_TRANSACTION”

    系统运行过程中,突然报错数据库tempdb的事物日志已满,原因为"ACTIVE_TRANSACTION".导致所有业务崩溃. 接到报警后,进入数据库服务器.检查硬盘空间正常,于是登 ...

  8. SharePoint 2010 数据库xxx的事务日志已满

    接到领导安排,说客户有问题 请求协助解决,对方给我展示的错误日志,如下: 数据库'WSS_Content_xxxx'的事务日志已满.若要查明无法重用日志中的空间的原因,请参阅sy.databases中 ...

  9. 传递给数据库 'model' 中的日志扫描操作的日志扫描号无效

    状况描述:在服务器的管理中重新启动MSSQLSERVER启动后马上又停止   通过"事件查看器" 发现 错误: ,严重度: ,状态: LSN(::)无效.该 LSN 是传递给数据库 ...

  10. 使用ODBC 数据库 ,运行程序时 出现 “遇到不适当的参数”

    我知道的一种情况是 数据库打开了,没有关闭,再次调用数据库打开函数,会出现这样错误.当然是打开同一个数据库同一张表.

随机推荐

  1. 韦东山freeRTOS系列教程之【第三章】任务管理

    目录 系列教程总目录 概述 3.1 基本概念 3.2 任务创建与删除 3.2.1 什么是任务 3.2.2 创建任务 3.2.3 示例1: 创建任务 3.2.4 示例2: 使用任务参数 3.2.5 任务 ...

  2. 在OwinSelfHost项目中获取客户端IP地址

    在OwinSelfHost项目中,获取客户端的IP地址可以通过以下方法获得: base.Request.GetOwinContext().Request.RemoteIpAddress 创建一个Owi ...

  3. 使用scikit-learn构建模型

    sklearn中还存在许多不同的机器学习模型可以直接调用,相比于自己撰写代码,直接使用sklearn的模型可以大大提高效率. sklearn中所有的模型都有四个固定且常用的方法,分别是model.fi ...

  4. 4. 系统I/O

    系统 I/O 示例代码: #include <iostream> // 标准库头文件 // #include "myheader.h" // 自己写的头文件 void ...

  5. 深入理解 React 的 useSyncExternalStore Hook

    深入理解 React 的 useSyncExternalStore Hook 大家好,今天我们来聊聊 React 18 引入的一个新 Hook:useSyncExternalStore.这个 Hook ...

  6. 怎么用git命令将其他分支的提交记录提取到当前分支上

    您可以使用 Git 命令 "cherry-pick" 将其他分支的提交记录提取到当前分支上.以下是使用 cherry-pick 命令的步骤:1. 切换到当前分支: `git che ...

  7. webpack4.15.1 学习笔记(四) — Tree shaking

    目录 Tree shaking 原理 标记效果 副作用代码不可被删除 如何实现 Tree shaking 的几种方法 总结 Tree shaking 本质上为了消除无用的js代码,减少加载文件体积的方 ...

  8. MiniAuth 一个轻量 ASP.NET Core Identity Web 后台管理中间插件

    MiniAuth 一个轻量 ASP.NET Core Identity Web 后台管理中间插件 「一行代码」为「新.旧项目」 添加 Identity 系统跟用户.权限管理网页后台系统 开箱即用,避免 ...

  9. 兼容sentry协议的轻量级监控,glitchtip

    前言 上一篇文章说了重启 sentry 的事 因为过程太折腾了,一度想过放弃 sentry 换成其他比较轻量级的开源监控系统 这不就给我找到了另外俩个 https://glitchtip.com/ h ...

  10. Python threading实现多线程 提高篇 线程同步,以及各种锁

    本文主要讲多线程的线程之间的资源共享怎么保持同步. 多线程基础篇见,Python threading实现多线程 基础篇 Python的多线程,只有用于I/O密集型程序时效率才会有明显的提高,如文件/输 ...