Crs无法正常启动,也无法关闭。
[root@rac101 ~]# crsctl stop crs
Stopping resources. This could take several minutes.
Error while stopping resources. Possible cause: CRSD is down.

[root@rac101 ~]# crsctl check crs
Failure 1 contacting CSS daemon
Cannot communicate with CRS
Cannot communicate with EVM

ocssd进程也启动了。
[root@rac101 cssd]# ps -ef|grep ocssd
oracle    1214   670  0 01:58 ?        00:00:14 /db/oracle/product/10.2.0/crs/bin/ocssd.bin
root     10399 25837  0 02:19 pts/2    00:00:19 less ocssd.log
root     30373 25837  0 03:02 pts/2    00:00:00 grep ocssd

crsd进程则处于重启状态。
[root@rac101 cssd]# ps -ef|grep crsd
root     17385     1  0 02:34 ?        00:00:00 /bin/sh /etc/init.d/init.crsd run
root     17707 17385  0 02:34 ?        00:00:11 /db/oracle/product/10.2.0/crs/bin/crsd.bin restart
root     30851 25837  0 03:03 pts/2    00:00:00 grep crsd

crsd进程的日志中显示在等待ocssd进程
2012-11-29 03:05:07.585: [  CRSRTI][1639632]0CSS is not ready. Received status 3 from CSS. Waiting for good status ..

2012-11-29 03:05:08.785: [ COMMCRS][100719504]clsc_connect: (0x98f9bb0) no listener at (ADDRESS=(PROTOCOL=ipc)(KEY=OCSSD_LL_rac101_))

2012-11-29 03:05:08.786: [ CSSCLNT][1639632]clsssInitNative: connect failed, rc 9

2012-11-29 03:05:08.787: [  CRSRTI][1639632]0CSS is not ready. Received status 3 from CSS. Waiting for good status ..

2012-11-29 03:05:09.990: [ COMMCRS][100719504]clsc_connect: (0x98f9bb0) no listener at (ADDRESS=(PROTOCOL=ipc)(KEY=OCSSD_LL_rac101_))

2012-11-29 03:05:09.991: [ CSSCLNT][1639632]clsssInitNative: connect failed, rc 9

2012-11-29 03:05:09.991: [  CRSRTI][1639632]0CSS is not ready. Received status 3 from CSS. Waiting for good status ..

2012-11-29 03:05:11.196: [ COMMCRS][100719504]clsc_connect: (0x98f9bb0) no listener at (ADDRESS=(PROTOCOL=ipc)(KEY=OCSSD_LL_rac101_))

2012-11-29 03:05:11.196: [ CSSCLNT][1639632]clsssInitNative: connect failed, rc 9

2012-11-29 03:05:11.197: [  CRSRTI][1639632]0CSS is not ready. Received status 3 from CSS. Waiting for good status ..

2012-11-29 03:05:12.392: [ COMMCRS][100719504]clsc_connect: (0x98f9bb0) no listener at (ADDRESS=(PROTOCOL=ipc)(KEY=OCSSD_LL_rac101_))

2012-11-29 03:05:12.392: [ CSSCLNT][1639632]clsssInitNative: connect failed, rc 9

2012-11-29 03:05:12.392: [  CRSRTI][1639632]0CSS is not ready. Received status 3 from CSS. Waiting for good status ..

进程ocssd的日志中不停的报clssnmvReadDskHeartbeat: read ALL for Joining
 [    CSSD]2012-11-29 01:58:38.269 [90823568] >TRACE:   clssgmclientlsnr: Spawned
[    CSSD]2012-11-29 01:58:38.292 [90823568] >TRACE:   clsclisten: Permission denied for (ADDRESS=(PROTOCOL=ipc)(KEY=Oracle_CSS_LclLstnr_crs_1))
[    CSSD]2012-11-29 01:58:38.292 [90823568] >ERROR:   clssgmclientlsnr: listening failed for (ADDRESS=(PROTOCOL=ipc)(KEY=Oracle_CSS_LclLstnr_crs_1)) (3)
[    CSSD]2012-11-29 01:58:38.292 [90823568] >TRACE:   clssgmclientlsnr: listening on (ADDRESS=(PROTOCOL=ipc)(KEY=Oracle_CSS_LclLstnr_crs_1))
[    CSSD]2012-11-29 01:58:38.292 [90823568] >TRACE:   clssgmclientlsnr: listening on (ADDRESS=(PROTOCOL=ipc)(KEY=OCSSD_LL_rac101_crs))
[    CSSD]2012-11-29 01:58:38.292 [90823568] >TRACE:   clssgmclientlsnr: listening on (ADDRESS=(PROTOCOL=ipc)(KEY=OCSSD_LL_rac101_))
[    CSSD]2012-11-29 01:58:38.498 [50715536] >TRACE:   clssnmvKillBlockThread: spawned for disk 0 (/dev/raw/raw2) initial sleep interval (1000)ms
[    CSSD]2012-11-29 01:58:39.366 [40201104] >TRACE:   clssnmvReadDskHeartbeat: read ALL for Joining
[    CSSD]2012-11-29 01:58:40.432 [40201104] >TRACE:   clssnmvReadDskHeartbeat: read ALL for Joining
[    CSSD]2012-11-29 01:58:41.543 [40201104] >TRACE:   clssnmvReadDskHeartbeat: read ALL for Joining
…..
TRACE:  clsclisten: Permission denied for (ADDRESS=(PROTOCOL=ipc)(KEY=Oracle_CSS_LclLstnr_crs_1))这个报错显示是权限不允许,查看下了/tmp和ocr、votedisk的权限都是正常的。

其实每次重启服务器css进程会在/tmp/.oracle或/var/tmp/.oracle目录创建一系列socket.如果以前存在的sockets不能被重用或自动删除,那么服务就不能启动了,感觉是权限改变了不能写入socket文件。
[root@rac101 crsd]# cd /var/tmp/.oracle/
[root@rac101 .oracle]# ls -ld
drwxrwxrwt 2 root root 4096 Nov 29 01:39 .
[root@rac101 .oracle]# ls -al
total 12
drwxrwxrwt 2 root root 4096 Nov 29 03:28 .
drwxrwxrwt 3 root root 4096 Nov 29 03:29 ..
srwxrwxrwx 1 root root    0 Nov 29 03:28 s#5058.1
srwxrwxrwx 1 root root    0 Nov 29 03:28 s#5058.2
srwxrwxrwx 1 root root    0 Nov 29 03:27 sArac101_crs_evm
srwxrwxrwx 1 root root    0 Nov 29 03:27 sCrac101_crs_evm
srwxrwxrwx 1 root root    0 Nov 29 03:27 sCRSD_UI_SOCKET
srwxrwxrwx 1 root root    0 Nov 29 03:27 sOCSSD_LL_rac101_
srwxrwxrwx 1 root root    0 Nov 29 03:27 sOCSSD_LL_rac101_crs
srwxrwxrwx 1 root root    0 Nov 29 03:27 sOracle_CSS_LclLstnr_crs_1
srwxrwxrwx 1 root root    0 Nov 29 03:27 sora_crsqs
srwxrwxrwx 1 root root    0 Nov 29 03:28 sora_racg_xiaoyu_rac101
srwxrwxrwx 1 root root    0 Nov 29 03:27 sprocr_local_conn_0_PROC
srwxrwxrwx 1 root root    0 Nov 29 03:27 srac101DBG_CRSD
srwxrwxrwx 1 root root    0 Nov 29 03:27 srac101DBG_CSSD
srwxrwxrwx 1 root root    0 Nov 29 03:27 srac101DBG_EVMD
srwxrwxrwx 1 root root    0 Nov 29 03:27 sSYSTEM.evm.acceptor.auth

问题已经很明显了,删除这个目录/var/tmp/.oracle后,重启机器后crs可以正常启动,关于rac的处理还是要借助crs的日志,系统的日志来得到详细的信息。
[root@rac101 .oracle]# ls -al
total 12
drwxrwxrwt 2 root   root     4096 Nov 29 03:28 .
drwxrwxrwt 3 root   root     4096 Nov 29 03:29 ..
srwxrwxrwx 1 oracle oinstall    0 Nov 29 03:28 s#5058.1
srwxrwxrwx 1 oracle oinstall    0 Nov 29 03:28 s#5058.2
srwxrwxrwx 1 oracle oinstall    0 Nov 29 03:27 sArac101_crs_evm
srwxrwxrwx 1 oracle oinstall    0 Nov 29 03:27 sCrac101_crs_evm
srwxrwxrwx 1 root   root        0 Nov 29 03:27 sCRSD_UI_SOCKET
srwxrwxrwx 1 oracle oinstall    0 Nov 29 03:27 sOCSSD_LL_rac101_
srwxrwxrwx 1 oracle oinstall    0 Nov 29 03:27 sOCSSD_LL_rac101_crs
srwxrwxrwx 1 oracle oinstall    0 Nov 29 03:27 sOracle_CSS_LclLstnr_crs_1
srwxrwxrwx 1 root   root        0 Nov 29 03:27 sora_crsqs
srwxrwxrwx 1 oracle oinstall    0 Nov 29 03:28 sora_racg_xiaoyu_rac101
srwxrwxrwx 1 root   root        0 Nov 29 03:27 sprocr_local_conn_0_PROC
srwxrwxrwx 1 root   root        0 Nov 29 03:27 srac101DBG_CRSD
srwxrwxrwx 1 oracle oinstall    0 Nov 29 03:27 srac101DBG_CSSD
srwxrwxrwx 1 oracle oinstall    0 Nov 29 03:27 srac101DBG_EVMD
srwxrwxrwx 1 oracle oinstall    0 Nov 29 03:27 sSYSTEM.evm.acceptor.auth

socket文件权限变更引起crs无法启动故障的更多相关文章

  1. hosts文件权限导致监听无法启动

    1.所属系统:2.问题描述:3.解决4.参考???疑点:为什么修改主机名会使hosts文件权限发生改变 1.所属系统: ZHJS2#[/]uname -a HP-UX ZHJS2 B.11.31 U ...

  2. tomcat的日志文件权限与启动用户的权限不一致

    用户work的文件权限(umask=0002)为 u=rwx,g=rwx,o=rx 但是tomcat的日志文件的权限却是:为什么会不一样呢? 这是因为tomcat在启动(catalina.sh)时会重 ...

  3. CentOS学习笔记--文件权限概念

    Linux 文件权限概念 当你的屏幕出现了『Permission deny』的时候,不要担心,『肯定是权限设定错误』啦!(以下节选自 鸟哥的 Linux 私房菜 第六章.Linux 的文件权限与目录配 ...

  4. Linux学习之CentOS(四)----Linux文件属性、所有者、群组、其他组及文件权限操作简要总结

    Linux文件属性.所有者.群组.其他组及文件权限操作简要总结 首先介绍一个重要的知识点:文件属性控制权限 [root@www ~]# ls -al total 156 drwxr-x--- 4 ro ...

  5. 网卡配置文件详解 用户管理与文件权限篇 文件与目录权限 软连接 tar解压命令 killall命令 linux防火墙 dns解析设置 计划任务crond服务 软件包安装 阿里云 yum源 安装

    Linux系统基础优化及常用命令 Linux基础系统优化 引言没有,只有一张图. Linux的网络功能相当强悍,一时之间我们无法了解所有的网络命令,在配置服务器基础环境时,先了解下网络参数设定命令. ...

  6. 【转】第六章、Linux 的文件权限与目录配置

    原文网址:http://vbird.dic.ksu.edu.tw/linux_basic/0210filepermission.php 最近更新日期:2009/08/18 Linux最优秀的地方之一, ...

  7. 详解Linux系统中的文件名和文件种类以及文件权限

    Linux文件种类与副文件名 一直强调一个概念,那就是:任何装置在Linux底下都是文件, 不仅如此,连资料沟通的介面也有专属的文件在负责-所以,你会瞭解到,Linux的文件种类真的很多- 除了前面提 ...

  8. Linux文件系统简介一(磁盘分区、开机过程、目录结构、文件权限、文件扩展名、目录管理)

    Linux:就是一组软件,一套操作系统=核心+系统呼叫接口层. 1.操作系统 操作系统 = 核心(内核) + 系统呼叫(接口) 操作系统其实也是一组程序,重点在于管理计算机的所有活动以及驱动系统中的所 ...

  9. 由于OCR文件损坏造成Oracle RAC不能启动的现象和处理方法

    v$cluster_interconnects 集群节点间通信使用的IP地址 错误信息 使用了公网进行连接 SQL> select * from v$cluster_interconnects; ...

随机推荐

  1. mac下在eclipse中怎样清除/切换svn

    1.打开终端,即用户的根文件夹(用户的home文件夹) 进入.subversion下的auth文件夹 localhost:auth brj$ pwd /Users/brj/.subversion/au ...

  2. Hibernate的批量操作

    在实际的操作中,会经常的遇到批量的操作,使用hibernate将 100条记录插入到数据库的一个很自然的做法可能是这样的 Session session = sessionFactory.openSe ...

  3. shell脚本中执行mysql 语句,去除warning using a password on the command line interface can be insecure信息

    方法二:使用mysql参数的方法 mysql -u$user -p$pass -D $db -e "select host from user;"当然,可以通过将传参的方式来传递 ...

  4. C语言之指针基础概念

    今天就写一下关于C语言指针的一些感想吧. 很多同学都搞不懂指针,我一开始也云里雾里没看懂指针,而且老师又把指针说得很难的样子.其实主要是把指针”*“的作用给弄混了,不用畏惧,细心点看就可以了. 首先简 ...

  5. linux系统常用命令 -设置文件夹读写权限

    设置文件夹的读写权限: sudo chmod -R 777 /data 权限码描述 sudo chmod 600 ××× (只有所有者有读和写的权限)sudo chmod 644 ××× (所有者有读 ...

  6. PL/SQL 美化器不能解析文本

    1.问题:PL/SQL美化器不能解析文本 原始sql语句如下: CREATE OR REPLACE VIEW V_GGXZBM AS SELECT XZBM,XZMC,CASE WHEN PARENT ...

  7. oracle 某一字段取反

    --某一位取反select id ,flag,(flag + 1) - BITAND(flag, 1) * 2 from SYS_INFO t UPDATE SYS__INFO SET FLAG=(( ...

  8. jfinal的configPlugin基本配置代码

    直接上代码: public void configPlugin(Plugins me) { // 这里是在数据库的配置文件中读取数据库的一些信息 DruidPlugin dbPlugin = new ...

  9. 一个来自红帽的Java垃圾回收算法,试图把停顿时间降到10毫秒以下 原创 2017-01-10 薛命灯

    转自 微信聊聊架构 GC... 早在三年前,Red Hat就启动了Shenandoah项目.Shenandoah是一种新的Java虚拟机GC算法,目标是利用现代多核CPU的优势,减少大堆内存在GC方面 ...

  10. SVN服务器更改ip地址客户端怎么设置(转载)

    SVN 服务器 IP 地址修改后,客户端对服务器的连接可以采用以下的方法重定位: 1. 如果客户端工具是TortoiseSVN,直接在工作副本上右键,选择TortoiseSVN->relocat ...