clusterware启动顺序——CRSD
CRSD层面
1.启动过程
)导致">CRSD无法启动集群的应用程序资源的可能原因有:">
原因:/etc/oracle/ocr.loc指向了错误的OCR文件
[grid@ebsdb1 11.2.0]$ cat
/etc/oracle/ocr.loc
ocrconfig_loc=+VOTE_DG
local_only=FALSE
原因::代理进程对应的二进制文件丢失或者损坏。
原因:集群的私网出现问题,从而导致crsd.bin无法和远程节点通信。
原因:::修改:从正常的OCR备份中恢复OCR。:从正常的节点上复制代理进程的二进制文件到有问题的节点。
方法:确认私网能够正常工作。
方法:确认$GRID_HOME/bin/crsd.bin文件的权限正确。如果问题是crsd.bin文件损坏,可以从正常的节点上复制该文件到问题节点。
[grid@ebsdb1 11.2.0]$ ls -l
$GRID_HOME/bin/crsd.bin
-rwxr----x 1 root oinstall 106051083 Jun
16 2014 /ebsdb/grid/11.2.0/bin/crsd.bin
方法:删除有问题的$GRID_HOME/crs/init/*.pid文件,之后重新启动)导致">VIP或">SCAN VIP无法正常启动的可能原因:">
原因:由于网络问题导致集群公网资源无法启动。
原因:由于:::确认集群公网能够正常工作,而且公网资源ora.net1.network正常工作。
方法:确认:使用:使用ifconfig命令和/etc/hosts中的信息确认OS层面的公网配置,之后通过以下的命令检查OCR中的配置
[grid@ebsdb1 11.2.0]$ oifcfg getif -global
eth0172.28.1.0 global public
eth1192.168.10.0 global cluster_interconnect
[grid@ebsdb1 11.2.0]$ srvctl config
nodeapps -a
Network exists:
1/172.28.1.0/255.255.255.0/eth0, type static
VIP exists:
/ebsdbvip1/172.28.1.223/172.28.1.0/255.255.255.0/eth0, hosting node ebsdb1
VIP exists:
/ebsdbvip2/172.28.1.224/172.28.1.0/255.255.255.0/eth0, hosting node ebsdb2
[grid@ebsdb1 11.2.0]$ srvctl config scan
SCAN name: ebsscan, Network:
1/172.28.1.0/255.255.255.0/eth0
SCAN VIP name: scan1, IP:
/ebsscan/172.28.1.225
(">3)导致">Listener或">SCAN Listener无法正常启动的可能原因">
由于)">ora.asm和磁盘组资源无法正常启动的可能原因">
对于">ora.asm,由于这个资源实际上是初始化资源">ora.asm的一个代理资源,这个资源可能出现问题的原因可以参考之前的内容。而对于磁盘组资源">ora.<磁盘组名">>.dg,它实际上是用于反映对应">ASM磁盘组的状态,如果这个资源无法启动,那在绝大部分情况下表明对应的">ASM磁盘组没有被挂载,而磁盘组无法挂载的主要原因就是底层对应的">ASM磁盘出现了问题,例如:某些磁盘的权限和属主错误、磁盘头信息错误、磁盘无法访问等。">
解决办法如下:">
方法">1:修正">ASM磁盘的权限和属主信息,对应的基本原则是:">ASM磁盘的属主应该是">grid用户,对应的组应该是">asmadmin,而且">grid用户和">asmadmin组都应该对磁盘组有读写权限。">
方法">2:从">11.1.0.7版本开始,">ASM磁盘头信息会自动备份到">AU#1的倒数第二个块中。对于">AU大小为">1MB的磁盘组,每个">AU包括的块数量">=1024KB/4KB=256个,备份信息位于">AU#1的第">254号块(从">0号开始)。可以使用下面的命令手动恢复备份的磁盘头信息:">
kfed repair /dev/oracleasm/disks/DATA1
aus=1048576
方法">3:如果磁盘无法被访问,那绝大部分情况下都是由操作系统或存储层面的问题导致的。">
(">5)数据库资源或数据库服务资源无法启动的可能原因">
对于数据库资源,实际上代理进程完成的工作就是通过资源的定义,执行startup spfile=<spfile位置>命令。而对于数据库服务资源,代理进程执行的命令就是alter
system set service_names=<数据库服务名称> sid=<数据库实例名>。可能导致它们无法启动的原因如下:
原因:数据库资源的某些属性配置错误,如果数据库的启动选项被设置成了nomount,这表示代理进程会使用“startup nomount”的方式启动数据库。如果数据库角色被设置成了STANDBY,则表示代理进程认为这是一个备用数据库,那么数据库在启动时会导致问题。
原因:数据库的health check文件($ORACLE_HOME/dbs/hc_<实例名:操作系统验证被禁用。
原因::数据库资源所依赖的磁盘组没有被挂载。
对应的解决方法如下:
方法:确保数据库资源在OCR中的属性是正确的,以下是一个正常的数据库资源属性的输出
[orasit@ebsdb1 ~]$ srvctl config database
-d sit
Database unique name: SIT
Database name:
Oracle home: /ebsdb/sit/db/tech_st/11.2.0
Oracle user: orasit
Spfile:
Domain:
Start options: open
Stop options: immediate
Database role: PRIMARY
Management policy: AUTOMATIC
Server pools: SIT
Database instances: SIT1,SIT2
Disk Groups: DATA_DG
Mount point paths:
Services:
Type: RAC
Database is administrator managed
方法:确保数据库的health check文件存在而且能够访问,例如
[orasit@ebsdb1 ~]$ ls -l $ORACLE_HOME/dbs
total 31812
……
-rw-rw---- 1 orasit oinstall 1544 Feb 10 18:56 hc_SIT1.dat
……
方法:启用操作系统验证。在$ORACLE_HOME/network/admin/sqlnet.ora文件中将一下行注释掉或者直接删除。:确保$ORACLE_HOME/bin下的Oracle二进制文件的权限或者属主配置正确,例如
[orasit@ebsdb1 ~]$ ls -l
$ORACLE_HOME/bin/oracle
-rwsr-s--x 1 orasit asmadmin 239729642
Feb 8 11:55 /ebsdb/sit/db/tech_st/11.2.0/bin/oracle
方法:确保数据库所在的磁盘组已经被挂载。如果磁盘组对应的磁盘存在问题,在解决了磁盘组层面的问题后,使用类似于下面的命令挂载磁盘组:
alter diskgroup DATA mount;
如果磁盘组的冗余度是">normal或者">high,而只是个别的磁盘出现了问题,且没有数据丢失,可以使用类似下面的命令强制挂载磁盘">
alter diskgruop DATA mount force;
clusterware启动顺序——CRSD的更多相关文章
- clusterware启动顺序——OHASD
Clusterware启动顺序 [root@ebsdb1 etc]# crsctl check crs CRS-4638: Oracle High Availability Services is ...
- clusterware启动顺序——CSS
CSS层面 1.ocssd.bin守护进程 该层面最主要的工作就是启动ocssd.bin守护进程.使本地节点能够成功地加入集群.ocssd.bin守护进程的启动过程可以通过以下的图形进行描述. ::: ...
- 11G GI启动顺序
--11gR2 Clusterware and Grid Home - What You Need to Know (文档 ID 1053147.1) 上图来自<Oracle C ...
- bay——RAC 关闭和启动顺序,状态查看.txt
oracle 11g rac 关闭和启动顺序,状态查看https://www.cnblogs.com/hellojesson/p/4501112.html----------------------- ...
- linux init 启动顺序
redhat init大致启动过程 第一个运行的程序是/sbin/init,该文件会读取/etc/inittab文件,并依据此文件来进行初始化工作.比如在设定了运行等级 “:id:3:initdefa ...
- Openwrt笔记-IPv6与启动顺序
之前使用了nat6方案和x3c8021x实现了校园网上网和IPv6连接:但实际使用时经常出现莫名奇妙的问题.IPv6状态要么是无法连接网络,要么是无法连接Internet:经过研究,发现大概是自启动项 ...
- [CrunchBang]修改win+ubuntu 双 系统菜单的 启动顺序 引导
说到启动就不得不说GRUB,Linux下大名鼎鼎的启动管理工具(曾经的LILO已经风光不再),当然现在已经是GRUB2了,GRUB2和GRUB最重要的区别就是,GRUB存放系统启动信息的文件为/boo ...
- linux服务开机启动顺序
今天遇到了一个问题,我们写了一个服务脚本A,该服务需要优先于mysql启动.脚本是从其他地方拷来的模板,前面的默认配置没改,只是实现了自己的功能.写完,chkconfig A on,reboot,启动 ...
- 设置U盘为第一启动顺序
本文转载:http://u.diannaodian.com/Article/1004.html 盘安装系统的首要步骤就是设置U盘为第一启动顺序.下面电脑店官网就来说说到底如何来设置U盘启动顺序吧. ...
随机推荐
- Maven下载与环境变量配置
前言: Maven 是一个基于 Java 的工具,所以要做的第一件事情就是安装 JDK.如果还未安装 JDK,可以参考Win10下JDK下载与环境变量配置. 项目 要求 JDK Maven 3.3+ ...
- Java的异常机制
Java的异常机制 (一)异常的概念 异常是指程序在编译或运行时出现的导致程序不能继续编译或运行的状况.. (二)Throwable类 Throwable类继承自Object类,是Java中所有错误或 ...
- c++有关构造函数、析构函数和类的组合的一个简单例子
来源链接 实验四(下) 代码 #include <iostream> using namespace std; enum CPU_Rank {P1 = 1, P2, P3, P4, P5, ...
- 自学PYTHON分享 --基础1
1.python2和python3的区别: 宏观上:python2 与 python3 区别: python2 源码不标准,混乱,重复代码太多, python3 统一 标准,去除重复代码. 2.pyt ...
- RESTful协议
目的:在符合架构原理的前提下,理解和评估以网络为基础的应用软件的架构设计,得到一个功能强.性能好.适宜通信的架构 解决问题:如何开发在互联网环境中使用的软件,实现网站即软件 涉及主要元素 资源(Res ...
- vue 用huilder打包APP时,安卓按返回键就退出App改为按两次再退出App
做vue项目时,用Hbuilder打包APP,在安卓下按返回键就是退出了APP,百度了下.都是使用到MUI来解决的,自己也记录下. 在main.js里面引入mui.js并使用. import mui ...
- bash: ./xxx 权限不够
Linux环境下要运行C编译的一个可执行文件play,终端cd到当前目录后输入./play,提示 bash: ./xxx 权限不够 用sudo, 提示 sudo:./play: command no ...
- 高可用性的负载均衡方案之lvs+keepalived和haproxy+heartbeat区别
高可用性的负载均衡方案 目前使用比较多的就是标题中提到的这两者,其实lvs和haproxy都是实现的负载均衡的作用,keepalived和heartbeat都是提高高可用性的,避免单点故障.那么他们为 ...
- 在CentOS 7 上设置返回上一级目录的快捷键为 Backspace
参考这里. 编辑文件: $ vi ~/.config/nautilus/accels 找到这一行: ; (gtk_accel_path "<Actions>/ShellActi ...
- 正则--test exec search match replace
1:test 是正则对象的方法不是字符串的方法,使用例子:正则对象也就是那个设定好的模式对象 var str = "hello world!"; var result = /^he ...