问题现象：

在自己的工作站中安装的RAC测试环境，使用了iSCSI模拟共享存储，环境运行OK，但是在messages信息中频繁报错如下：

[root@db01rac2 ~]# tail -20f /var/log/messages

Jan 13 23:08:37 db01rac2 iscsid: iscsid: connecting to 192.168.1.10:3260

Jan 13 23:08:37 db01rac2 iscsid: iscsid: connected local port 64350 to 192.168.1.10:3260

Jan 13 23:08:37 db01rac2 iscsid: iscsid: login response status 0000

Jan 13 23:08:37 db01rac2 iscsid: iscsid: deleting a scheduled/waiting thread!

Jan 13 23:08:37 db01rac2 iscsid: iscsid: connection1:0 is operational after recovery (1 attempts)

Jan 13 23:08:39 db01rac2 iscsid: iscsid: Kernel reported iSCSI connection 1:0 error (1020 - ISCSI_ERR_TCP_CONN_CLOSE: TCP connection closed) state (3)

Jan 13 23:08:39 db01rac2 iscsid: iscsid: re-opening session 1 (reopen_cnt 0)

Jan 13 23:08:39 db01rac2 iscsid: iscsid: disconnecting conn 0x55beee57de90, fd 6

Jan 13 23:08:39 db01rac2 kernel: connection1:0: detected conn error (1020)

Jan 13 23:08:41 db01rac2 iscsid: iscsid: Poll was woken by an alarm

Jan 13 23:08:41 db01rac2 iscsid: iscsid: re-opening session 1 (reopen_cnt 0)

根据

https://community.oracle.com/customerconnect/discussion/637349/iscsid-kernel-reported-iscsi-connection-1-0-error-1020-iscsi-err-tcp-conn-close

的说法是：

This is normal and can be safely ignored.

The error sequence indicates that there was a temporary problem in connectivity to the storage backend but it was safely recovered within seconds.

但是，这是持续在/var/log/messages中报错的，虽然未影响RAC使用，但是总觉得这样刷日志肯定是不正常的，继续查询：

在suse的一篇文章中，

https://www.suse.com/zh-cn/support/kb/doc/?id=000020752

The systemd journal, by default also written to /var/log/messages, fills with similar messages when an iSCSI LUN is shared across multiple nodes.

这个写的场景很匹配，我这里就是两个节点共享同样的iSCSI LUN，但是究竟能否忽略这个错误呢？

或是有别的设置？

1.确保IQN的名字唯一性

如果我们需要避免这样的情况发生。需要在节点上修改IQN，避免重名。

而其实我这里原本这个文件是不一样的，但确实在配置时修改成一样的了：

cat /etc/iscsi/initiatorname.iscsi

[root@db01rac1 ~]# cat /etc/iscsi/initiatorname.iscsi

#InitiatorName=iqn.1988-12.com.oracle:178a747c44

InitiatorName=iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6:client

[root@db01rac2 ~]# cat /etc/iscsi/initiatorname.iscsi

#InitiatorName=iqn.1988-12.com.oracle:b8e5b14ad0fa

InitiatorName=iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6:client

可是如果不一样的话，按我现在的配置，就无法识别开机启动挂载盘；

那为何无法识别？是不是iSCSI服务端的ACL配置问题？

下面来验证下，先把 /etc/iscsi/initiatorname.iscsi 改回默认值，两个节点不一样；

[root@db01rac1 ~]# cat /etc/iscsi/initiatorname.iscsi

InitiatorName=iqn.1988-12.com.oracle:178a747c44

[root@db01rac2 ~]# cat /etc/iscsi/initiatorname.iscsi

InitiatorName=iqn.1988-12.com.oracle:b8e5b14ad0fa

如果不重启机器，直接尝试logout和login是没问题的：

iscsiadm -m node

iscsiadm -m discovery -t st -p 192.168.1.10

iscsiadm -m node -T iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6 -p 192.168.1.10 --login

--以节点2为例：

[root@db01rac2 ~]# iscsiadm -m node -T iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6 -p 192.168.1.10 --logout

Logging out of session [sid: 1, target: iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6, portal: 192.168.1.10,3260]

Logout of [sid: 1, target: iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6, portal: 192.168.1.10,3260] successful.

[root@db01rac2 ~]#

[root@db01rac2 ~]#

[root@db01rac2 ~]# lsblk

NAME        MAJ:MIN RM  SIZE RO TYPE MOUNTPOINT

vdb         251:16   0  100G  0 disk

└─ora-u01   252:2    0  100G  0 lvm  /u01

sr0          11:0    1 1024M  0 rom

vda         251:0    0   10G  0 disk

├─vda2      251:2    0    9G  0 part

│ ├─ol-swap 252:1    0    1G  0 lvm  [SWAP]

│ └─ol-root 252:0    0    8G  0 lvm  /

└─vda1      251:1    0    1G  0 part /boot

[root@db01rac2 ~]#

[root@db01rac2 ~]#

[root@db01rac2 ~]# iscsiadm -m node -T iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6 -p 192.168.1.10 --login

Logging in to [iface: default, target: iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6, portal: 192.168.1.10,3260] (multiple)

Login to [iface: default, target: iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6, portal: 192.168.1.10,3260] successful.

[root@db01rac2 ~]#

[root@db01rac2 ~]#

[root@db01rac2 ~]# lsblk

NAME        MAJ:MIN RM  SIZE RO TYPE MOUNTPOINT

sdf           8:80   0    1G  0 disk

sdd           8:48   0    1G  0 disk

vdb         251:16   0  100G  0 disk

└─ora-u01   252:2    0  100G  0 lvm  /u01

sr0          11:0    1 1024M  0 rom

sdg           8:96   0   30G  0 disk

sde           8:64   0    1G  0 disk

vda         251:0    0   10G  0 disk

├─vda2      251:2    0    9G  0 part

│ ├─ol-swap 252:1    0    1G  0 lvm  [SWAP]

│ └─ol-root 252:0    0    8G  0 lvm  /

└─vda1      251:1    0    1G  0 part /boot

sdh           8:112  0   16G  0 disk

但是如果重启了机器，会发现现有配置无法正常login操作：

[root@db01rac1 ~]# iscsiadm -m node

192.168.1.10:3260,1 iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6

[root@db01rac1 ~]# iscsiadm -m node -T iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6 -p 192.168.1.10 --login

Logging in to [iface: default, target: iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6, portal: 192.168.1.10,3260] (multiple)

iscsiadm: Could not login to [iface: default, target: iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6, portal: 192.168.1.10,3260].

iscsiadm: initiator reported error (24 - iSCSI login failed due to authorization failure)

iscsiadm: Could not log into all portals

2.修正iSCSI服务端ACL的配置

看起来真是iSCSI服务端ACL的配置问题，那就去服务端看下acl的配置：

acl

/> cd /iscsi/iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6/tpg1/acls/

/iscsi/iqn.20...2b6/tpg1/acls> create iqn.1988-12.com.oracle:178a747c44

/iscsi/iqn.20...2b6/tpg1/acls> create iqn.1988-12.com.oracle:b8e5b14ad0fa

/iscsi/iqn.20...2b6/tpg1/acls> delete iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6:client

再次节点1尝试login，发现果然成功：

[root@db01rac1 ~]# iscsiadm -m node -T iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6 -p 192.168.1.10 --login

Logging in to [iface: default, target: iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6, portal: 192.168.1.10,3260] (multiple)

Login to [iface: default, target: iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6, portal: 192.168.1.10,3260] successful.

ACL的配置我改为两个RAC节点的，删除了之前的配置，具体最终显示如下：

/iscsi/iqn.20...2b6/tpg1/acls> pwd

/iscsi/iqn.2003-01.org.linux-iscsi.storage.x8664:sn.d5fd6c3922b6/tpg1/acls

/iscsi/iqn.20...2b6/tpg1/acls> ls

o- acls .................................................................................................................. [ACLs: 2]

  o- iqn.1988-12.com.oracle:178a747c44 ............................................................................ [Mapped LUNs: 5]

  | o- mapped_lun0 ......................................................................................... [lun0 block/disk1 (rw)]

  | o- mapped_lun1 ......................................................................................... [lun1 block/disk2 (rw)]

  | o- mapped_lun2 ......................................................................................... [lun2 block/disk3 (rw)]

  | o- mapped_lun3 ......................................................................................... [lun3 block/disk4 (rw)]

  | o- mapped_lun4 ......................................................................................... [lun4 block/disk5 (rw)]

  o- iqn.1988-12.com.oracle:b8e5b14ad0fa .......................................................................... [Mapped LUNs: 5]

    o- mapped_lun0 ......................................................................................... [lun0 block/disk1 (rw)]

    o- mapped_lun1 ......................................................................................... [lun1 block/disk2 (rw)]

    o- mapped_lun2 ......................................................................................... [lun2 block/disk3 (rw)]

    o- mapped_lun3 ......................................................................................... [lun3 block/disk4 (rw)]

    o- mapped_lun4 ......................................................................................... [lun4 block/disk5 (rw)]

/iscsi/iqn.20...2b6/tpg1/acls>

这样，最终测试，重启两个rac节点，磁盘挂载正常，且再次查询/var/log/messages信息，不再有iscsi的报错。

其实这个问题早在很多年前的测试我就遇到过，当时没有查出来原因就忽略了，因为也不影响测试，又不是自己的专业范围，而如今本着成长型思维，注重这些细节，终于还是找到了原因。最后看着清爽的messages信息，还是有些成就感的^_

iSCSI的客户端messages频繁报错问题解决的更多相关文章

遇到的eclipse启动报错问题解决
遇到的eclipse启动报错问题解决一.启动时出现Java was started but returned exit code=13 可能原因: 1.eclipse与JDK的不是都64位或者32位 ...
go语言，golang学习笔记3 用命令下载框架报错问题解决设置环境变量
go语言,golang学习笔记3 用命令下载框架报错问题解决设置环境变量下载安装:go get github.com/astaxie/beego 首页 - beego: 简约 & 强大并存 ...
javascript的倒计时功能中newData().getTime()在iOS下会报错问题解决
javascript的倒计时功能中newData().getTime()在iOS下会报错问题解决在做移动端时间转化为时间戳时,遇到了一个问题,安卓手机上访问时,能拿到时间戳,从而正确转换时间,而在i ...
kafka启动报错&问题解决
kafka启动报错&问题解决一早上班,就收到运维同事通知说有一台物理机宕机,导致虚拟机挂了.只得重启kafka服务器. 1.启动启动zookeeper bin/zkServer.sh st ...
NLTK数据包下载频繁报错——解决方法
问题描述:Nltk下载数据包,安装频繁报错. import nltk nltk.download() 运行上面的代码,下载nltk的数据包.但是在下载过程中因为各种问题导致网络传输失败,下载不成功. ...
映射内网ftp服务器到公网报错问题解决
这两天公司测试环境有个需求要让合作方通过ftp推送数据,一般内网环境是不会对公网开放ftp服务的,但是因为是临时需求就帮着搭了ftp服务,并且做了公网映射.ftp服务搭好之后在内网访问正常,但是在公网 ...
ssh com.jcraft.jsch.JSchException: Algorithm negotiation fail报错问题解决
我司自动安装部署工具ideploy,使用ssh连接主机并部署业务.今天提供给一线安装规划后,安装报错,测试连接主机失败,而直接使用ssh是可以连接上主机的.查看问题错误堆栈如下: ERROR pool ...
在Android工程中加入AIDL文件时，gen目录生成的文件报错-问题解决
from://http://blog.csdn.net/watt520/article/details/10099047 今天在弄清除缓存的东东,按照网上别人的方法,创建了一个AIDL文件,这个时候发 ...
Ubuntu安装 jdk.rpm 报错问题解决
报错问题出现原因第一次使用Ubuntu操作系统,很多命令及软件安装方式与以往使用的Linux操作系统(CentOS)有很大区别.现在总结使用Ubuntu在安装JDK中,遇到的问题及解决方法. roo ...
安装scrapy报错问题解决
今天在安装scrapy时候,最后一步出现下面报错(操作系统为centerOS 6.4) error: Setup script exited with error: command 'gcc' fai ...

随机推荐

阿里云 X 森马 AIGC T恤设计大赛开启! 穿什么由你定，赢Airpods，作品定制联名T恤
"关于宇宙,我所知道的最富诗意的事实之一就是, 我们身体中的每一个原子都曾经存在于某一颗爆发的恒星里. 组成你左手的原子和组成你右手的原子很有可能来自不同的恒星, 而我们都是恒星的孩子, ...
【转载】内存基本概念-watermark&lowmem_reserve
概述当系统内存短缺的情况下仍去申请内存,可能会触发系统对内存的回收,那什么时候应该进行回收,回收到什么标准又可以停止回收,参考依据是什么?即本文将介绍的watermark(内存水位线),当检查wat ...
C语言常用字符串操作函数整理（详细全面）
目录字符串相关 1.char *gets(char *s); #include<stdio.h> 2.char *fgets(char *s, intsize, FILE *stream ...
wxpython窗体之间传递参数
如何界面存在frame1与frame2,通过frame1打开页面frame2,并将frame2的值传递给frame1 可以使用回调函数传值参考具体代码如下: # -*- coding: utf-8 - ...
c# 创建一个只接收消息的窗口
/// <summary> /// WM_COPYDATA消息,进程间传输信息专用结构 /// </summary> public struct COPYDATASTRUCT ...
[转帖]MySQL 官方出品，比 mydumper 更快的多线程逻辑备份工具-MySQL Shell Dump & Load
MySQL 官方出品,比 mydumper 更快的多线程逻辑备份工具-MySQL Shell Dump & Load - 知乎 (zhihu.com) 目录收起什么是 MySQL Sh ...
[转帖]如何理解 kernel.pid_max & kernel.threads-max & vm.max_map_count
https://www.cnblogs.com/apink/p/15728381.html 背景说明运行环境信息,Kubernetes + docker .应用系统java程序问题描述首先从Ku ...
Harbor修改默认网段以及设置开机启动的方法
Harbor修改默认网段以及设置开机启动的方法背景 docker 默认的网段是 172.16.xx.xx 网段. harbor进行设置时会自动加1 设置为 172.17.xx.xx 有时候这个网段是 ...
[转帖]Linux中查看各文件夹大小命令du -h --max-depth=1
https://www.cnblogs.com/the-tops/p/8798678.html 最近排查服务器异常的时候,常会遇到磁盘慢的情况,这个时候,查找那个文件夹占用的内存的时候常用到这个命令: ...
[转帖]TiDB系统调参实战经验
https://tidb.net/blog/c9466c40#TiDB%E7%B3%BB%E7%BB%9F%E8%B0%83%E5%8F%82%E5%AE%9E%E6%88%98%E7%BB%8F%E ...

iSCSI的客户端messages频繁报错问题解决

1.确保IQN的名字唯一性

2.修正iSCSI服务端ACL的配置

iSCSI的客户端messages频繁报错问题解决的更多相关文章

随机推荐

热门专题