一、 问题分析

有时会遇到sqlplus / as sysdba登录非常慢的问题,由于还没登录,通过数据库等待事件一般看不出来啥,需要用到strace这个分析利器。strace有很多参数,后面会列出,但分析时最常用的是以下几个


  1. strace -T -t -f -o strace_slow.log sqlplus / as sysdba
  2. #-f 跟踪由fork调用所产生的子进程.
  3. #-t 在输出中的每一行前加上时间信息.
  4. #-T 显示每一调用所耗的时间.

如果不加-f,不看子进程信息,结果类似


  1. open("/etc/hostid", O_RDONLY) = -1 ENOENT (No such file or directory) <0.000020>
  2. open("/etc/hostid", O_RDONLY) = -1 ENOENT (No such file or directory) <0.000018>
  3. uname({sys="Linux", node="xxxxx", ...}) = 0 <0.000017>
  4. stat("/etc/resolv.conf", {st_mode=S_IFREG|0644, st_size=0, ...}) = 0 <0.000018>
  5. open("/etc/resolv.conf", O_RDONLY) = 9 <0.000019>
  6. fstat(9, {st_mode=S_IFREG|0644, st_size=0, ...}) = 0 <0.000016>
  7. mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x2b880d500000 <0.000019>
  8. read(9, "", 4096) = 0 <0.000017>
  9. close(9) = 0 <0.000017>
  10. munmap(0x2b880d500000, 4096) = 0 <0.000019>
  11. uname({sys="Linux", node="xxxxx", ...}) = 0 <0.000015>
  12. write(10, "\4N\0\0\6\0\0\0\0\0\3s\3\0\0\0\0\0\0\0\0\0\0\0\0!\0\0\0"..., 1102) = 1102 <0.000018>
  13. read(11, "\4j\0\0\6\0\0\0\0\0\10\30\0\23\0\0\0\23AUTH_VERSION_S"..., 8208) = 1130 <1.257143> <---- 耗时最多
  14. open("/u01/app/oracle/product/11.2.0/dbhome_1/rdbms/mesg/oraus.msb", O_RDONLY) = 9 <0.000049>

可以从最右边每个调用的执行时间找到耗时最多的部分,但明显这还是看不出来为什么慢。

如果加上-f,就可以看到子进程信息,结果类似


  1. [pid 5350] sendto(6, "\2\0\0\0\f\0\0\0\6\0\0\0group\0\0\0", 20, MSG_NOSIGNAL, NULL, 0) = 20
  2. [pid 5350] poll([{fd=6, events=POLLIN|POLLERR|POLLHUP, revents=POLLIN|POLLERR|POLLHUP}], 1, 5000) = 1
  3. [pid 5350] recvmsg(6, {msg_name(0)=NULL, msg_iov(1)=[{"group\0", 6}], msg_controllen=24, {cmsg_len=20, cmsg_level=SOL_SOCKET, cmsg_type=SCM_RIGHTS, {7}}, msg_flags=0}, 0) = 6
  4. [pid 5350] fstat(7, {st_mode=S_IFREG|0600, st_size=217016, ...}) = 0
  5. [pid 5350] pread(7, "\1\0\0\0h\0\0\0D\254\0\0\1\0\0\0\250\305XP\0\0\0\0\323"..., 104, 0) = 104
  6. [pid 5350] mmap(NULL, 217016, PROT_READ, MAP_SHARED, 7, 0) = 0x2b646ca23000[pid 5350] close(7) = 0
  7. [pid 5350] close(6) = 0
  8. [pid 5350] getgid() = 501
  9. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_1.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  10. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_2.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  11. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_3.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  12. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_4.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  13. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_5.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  14. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_6.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  15. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_7.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  16. ...
  17. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_186.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = 6
  18. [pid 5350] write(6, "Audit file ", 11) = 11
  19. [pid 5350] write(6, "/u01/app/oracle/admin/bigb/adump"..., 55) = 55
  20. [pid 5350] write(6, "\n", 1) = 1
  21. ...
  22. [pid 5350] write(6, "Thu Mar 12 11:37:08 2015 +01:00\n", 32) = 32
  23. [pid 5350] write(6, "LENGTH : \'160\'", 14) = 14
  24. [pid 5350] write(6, "\n", 1) = 1
  25. [pid 5350] write(6, "ACTION :[7] \'CONNECT\'\nDATABASE U"..., 159) = 159
  26. [pid 5350] write(6, "\n", 1) = 1
  27. [pid 5350] write(12, "\0\225\0\0\6\0\0\0\0\0\10\0\0\4\1\0\0\0\0\0\1\0\0\0\0\0"..., 149 <unfinished ...>
  28. [pid 5344] <... read resumed> "\0\225\0\0\6\0\0\0\0\0\10\0\0\4\1\0\0\0\0\0\1\0\0\0\0\0"..., 8208) = 149

可以看到,sqlplus用户进程的PID为5344(最后一行)。它从读取系统调用开始,并fork出影子进程 pid 5350。由于是使用sysdba权限登录,5350进程在登录到数据库之前必须在审核日志中进行记录。因此它在audit_trail目录中基于PID 5350扫描已有文件,找到可用的最大序号,使用最大序号创建新审计文件然后写入。很明显基于PID 5350的审计文件越多,这个操作越耗时。

二、 解决方法

找到了慢的原因,解决方法很容易想到。如果安全并不要求要这些日志,可以保留比如最近一个月三个月的数据,多余的删除。如果需要,可以定期将文件挪到别的目录,避免adump下文件过多。关于如何快速删除大量小文件,参考:linux删除大量文件的6种方法_Hehuyi_In的博客-CSDN博客_linux删除大量文件

三、 strace参数含义


  1. -c 统计每一系统调用的所执行的时间,次数和出错的次数等.
  2. -d 输出strace关于标准错误的调试信息.
  3. -f 跟踪由fork调用所产生的子进程.
  4. -ff 如果提供-o filename,则所有进程的跟踪结果输出到相应的filename.pid中,pid是各进程的进程号.
  5. -F 尝试跟踪vfork调用.在-f时,vfork不被跟踪.
  6. -h 输出简要的帮助信息.
  7. -i 输出系统调用的入口指针.
  8. -q 禁止输出关于脱离的消息.
  9. -r 打印出相对时间关于,,每一个系统调用.
  10. -t 在输出中的每一行前加上时间信息.
  11. -tt 在输出中的每一行前加上时间信息,微秒级.
  12. -ttt 微秒级输出,以秒了表示时间.
  13. -T 显示每一调用所耗的时间.
  14. -v 输出所有的系统调用.一些调用关于环境变量,状态,输入输出等调用由于使用频繁,默认不输出.
  15. -V 输出strace的版本信息.
  16. -x 以十六进制形式输出非标准字符串
  17. -xx 所有字符串以十六进制形式输出.
  18. -a column
  19. 设置返回值的输出位置.默认 为40.
  20. -e expr
  21. 指定一个表达式,用来控制如何跟踪.格式如下:
  22. [qualifier=][!]value1[,value2]...
  23. qualifier只能是 trace,abbrev,verbose,raw,signal,read,write其中之一.value是用来限定的符号或数字.默认的 qualifier是 trace.感叹号是否定符号.例如:
  24. -eopen等价于 -e trace=open,表示只跟踪open调用.而-etrace!=open表示跟踪除了open以外的其他调用.有两个特殊的符号 all 和 none.
  25. 注意有些shell使用!来执行历史记录里的命令,所以要使用\\.
  26. -e trace=set
  27. 只跟踪指定的系统 调用.例如:-e trace=open,close,rean,write表示只跟踪这四个系统调用.默认的为set=all.
  28. -e trace=file
  29. 只跟踪有关文件操作的系统调用.
  30. -e trace=process
  31. 只跟踪有关进程控制的系统调用.
  32. -e trace=network
  33. 跟踪与网络有关的所有系统调用.
  34. -e strace=signal
  35. 跟踪所有与系统信号有关的 系统调用
  36. -e trace=ipc
  37. 跟踪所有与进程通讯有关的系统调用
  38. -e abbrev=set
  39. 设定 strace输出的系统调用的结果集.-v 等与 abbrev=none.默认为abbrev=all.
  40. -e raw=set
  41. 将指 定的系统调用的参数以十六进制显示.
  42. -e signal=set
  43. 指定跟踪的系统信号.默认为all.如 signal=!SIGIO(或者signal=!io),表示不跟踪SIGIO信号.
  44. -e read=set
  45. 输出从指定文件中读出 的数据.例如:
  46. -e read=3,5
  47. -e write=set
  48. 输出写入到指定文件中的数据.
  49. -o filename
  50. 将strace的输出写入文件filename
  51. -p pid
  52. 跟踪指定的进程pid.
  53. -s strsize
  54. 指定输出的字符串的最大长度.默认为32.文件名一直全部输出.
  55. -u username
  56. 以username 的UID和GID执行被跟踪的命令

关于strace的其他使用案例,参考

Slow SQL*Plus Login | Oracle Database Blog: Experiments & Learnings

Linux strace命令 - ggjucheng - 博客园

https://blogs.oracle.com/database4cn/sqlplus

strace解决sqlplus登陆缓慢的问题一例_crc89714的博客-CSDN博客

实战例子:用strace分析数据库连接问题_记忆碎片的技术博客_51CTO博客

strace 解决 mysql 连接数据库总是定位/tmp/mysql.sock的问题_小鱼的技术博客_51CTO博客

文章知识点与官方知识档案匹配,可进一步学习相关知识
CS入门技能树Linux入门初识Linux32621 人正在系统学习中

[转帖]strace分析sqlplus登录慢问题的更多相关文章

  1. Win7下SQLPlus登录时报错"SP2-1503:无法初始化Oracle调用界面"

    Oracle安装完毕,使用SQLPlus登录的时候报错"SP2-1503:无法初始化Oracle调用界面",然后一闪界面关闭,报错界面如下: 这个是因为在Win7需要管理员权限,右 ...

  2. amazeui页面分析之登录页面

    amazeui页面分析之登录页面 一.总结 1.tpl命名空间:tpl命名空间的样式都是从app.css里面来的,app.css用用来移动网站开发的样式 2.表单样式:am-form到am-form- ...

  3. ORACLE中的Net Configuration Assistant 点击后无反应, sqlplus登录数据库提示Oracle11g ORA-12560: TNS: 协议适配器错误

    首先是对于点击无反应问题: 如果是客户端下的Net Configuration Assistant可用,而服务器端的Net Configuration Assistant等工具不可用的原因如下. 环境 ...

  4. sqlplus登录信息,列出所有表,列在表结构,sqlplus行和列显示设置,别名,Null值问题,细木工,DISTINCT

     1 sqlplus登录方式: 普通用户登录: 登录eg:C:\>sqlplusscott/11  (格式:sqlplus username/password) 退出eg:quit退出 超级 ...

  5. v75.01 鸿蒙内核源码分析(远程登录篇) | 内核如何接待远方的客人 | 百篇博客分析OpenHarmony源码

    子曰:"不学礼,无以立 ; 不学诗,无以言 " <论语>:季氏篇 百篇博客分析.本篇为: (远程登录篇) | 内核如何接待远方的客人 设备驱动相关篇为: v67.03 ...

  6. 通过sqlplus 登录数据库服务器

    点击“运行”,输入"sqlplus",弹出 , 再往里面输入账号scott,密码tiger 或者,点击“运行”,输入"sqlplus /nolog",此时只打开 ...

  7. sqlplus登录、连接命令

    经常使用: sqlplus username/password  如:普通用户登录  sqlplus scott/tiger sqlplus username/password@net_service ...

  8. strace 分析 跟踪 进程错误

    strace是什么? 按照strace官网的描述, strace是一个可用于诊断.调试和教学的Linux用户空间跟踪器.我们用它来监控用户空间进程和内核的交互,比如系统调用.信号传递.进程状态变更等. ...

  9. oracle之用户名密码包含特殊字符时候怎么使用sqlplus登录

    oracle有时候用户密码包含一些特殊字符直接登录会报错,需要使用以下方式登录sqlplus sqlplus 'username/"password"' PS:整体使用单引号括起来 ...

  10. sqlplus登录远程数据库与数据导出

    一.登录 1.cmd中输入sqlplus /nolog 2.链接数据库,root是用户名,root123是密码,ORCL是数据库名.conn root/root123@192.168.1.27:152 ...

随机推荐

  1. CodeForces 1459C 数论 GCD

    CodeForces 1459C 数论 GCD 原题链接 题意 首先给出n个数 之后给出m个数,每次问之前的n个数加上当前的这个数之后,总体的gcd是多少,也就是答案需要求出m个总体的gcd 思路 因 ...

  2. Spring系列:基于注解的方式构建IOC

    目录 一.搭建子模块spring6-ioc-annotation 二.添加配置类 三.使用注解定义 Bean 四.@Autowired注入 五.@Resource注入 六.全部代码 从 Java 5 ...

  3. 实践GoF的设计模式:访问者模式

    摘要:访问者模式的目的是,解耦数据结构和算法,使得系统能够在不改变现有代码结构的基础上,为对象新增一种新的操作. 本文分享自华为云社区<[Go实现]实践GoF的23种设计模式:访问者模式> ...

  4. 华为云GaussDB专家走进课堂,跟莘莘学子聊聊数据库

    摘要:华为云GaussDB走进北邮,技术专家走进课堂带来数据库前沿资讯. 近期,各地疫情又一次席卷而来,居家隔离成为常态.不过,外出的不便并没有阻挡莘莘学子求知的渴望,线上课堂成为了大多学生上课的主要 ...

  5. 如何在上架App之前设置证书并上传应用

    ​ App上架教程 在上架App之前想要进行真机测试的同学,请查看<iOS- 最全的真机测试教程>,里面包含如何让多台电脑同时上架App和真机调试. P12文件的使用详解 注意: 同样可以 ...

  6. Axure App 垂直滚动

    拖两个动态面版 最外层[动态面板]用来定义显示区域,高度:692 (根据实际来) 里面的[动态面板],用来放内容,高度根据实际情况来,示例中是:1920 如下图所示 里面的[动态面板]添加垂直滚动 外 ...

  7. FileLock 多进程文件锁

    FileLock是文件锁,它能保证同一时间只有一个进程(程序)能够修改它,或者都只可以读,这样就解决了多进程间的同步文件,保证了安全性.但是需要注意的是,它进程级别的,不是线程级别的,他可以解决多个进 ...

  8. MySQL 恢复误删除数据

    如图:我们将删除 id=2的数据,并恢复 SHOW BINARY LOGS; You are not using binary logging show binlog events in 'mysql ...

  9. 【JAVA基础】批处理脚本

    update ifp_project set is_self_run = 'N' where is_self_run is null; update ifp_invoice_header set is ...

  10. three.js 消防模拟火焰烟雾效果

    ParticleEngine.js实现烟雾效果 参考网址:http://stemkoski.github.io/Three.js/Particle-Engine.html ParticleEngine ...