一、 问题分析

有时会遇到sqlplus / as sysdba登录非常慢的问题,由于还没登录,通过数据库等待事件一般看不出来啥,需要用到strace这个分析利器。strace有很多参数,后面会列出,但分析时最常用的是以下几个


  1. strace -T -t -f -o strace_slow.log sqlplus / as sysdba
  2. #-f 跟踪由fork调用所产生的子进程.
  3. #-t 在输出中的每一行前加上时间信息.
  4. #-T 显示每一调用所耗的时间.

如果不加-f,不看子进程信息,结果类似


  1. open("/etc/hostid", O_RDONLY) = -1 ENOENT (No such file or directory) <0.000020>
  2. open("/etc/hostid", O_RDONLY) = -1 ENOENT (No such file or directory) <0.000018>
  3. uname({sys="Linux", node="xxxxx", ...}) = 0 <0.000017>
  4. stat("/etc/resolv.conf", {st_mode=S_IFREG|0644, st_size=0, ...}) = 0 <0.000018>
  5. open("/etc/resolv.conf", O_RDONLY) = 9 <0.000019>
  6. fstat(9, {st_mode=S_IFREG|0644, st_size=0, ...}) = 0 <0.000016>
  7. mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x2b880d500000 <0.000019>
  8. read(9, "", 4096) = 0 <0.000017>
  9. close(9) = 0 <0.000017>
  10. munmap(0x2b880d500000, 4096) = 0 <0.000019>
  11. uname({sys="Linux", node="xxxxx", ...}) = 0 <0.000015>
  12. write(10, "\4N\0\0\6\0\0\0\0\0\3s\3\0\0\0\0\0\0\0\0\0\0\0\0!\0\0\0"..., 1102) = 1102 <0.000018>
  13. read(11, "\4j\0\0\6\0\0\0\0\0\10\30\0\23\0\0\0\23AUTH_VERSION_S"..., 8208) = 1130 <1.257143> <---- 耗时最多
  14. open("/u01/app/oracle/product/11.2.0/dbhome_1/rdbms/mesg/oraus.msb", O_RDONLY) = 9 <0.000049>

可以从最右边每个调用的执行时间找到耗时最多的部分,但明显这还是看不出来为什么慢。

如果加上-f,就可以看到子进程信息,结果类似


  1. [pid 5350] sendto(6, "\2\0\0\0\f\0\0\0\6\0\0\0group\0\0\0", 20, MSG_NOSIGNAL, NULL, 0) = 20
  2. [pid 5350] poll([{fd=6, events=POLLIN|POLLERR|POLLHUP, revents=POLLIN|POLLERR|POLLHUP}], 1, 5000) = 1
  3. [pid 5350] recvmsg(6, {msg_name(0)=NULL, msg_iov(1)=[{"group\0", 6}], msg_controllen=24, {cmsg_len=20, cmsg_level=SOL_SOCKET, cmsg_type=SCM_RIGHTS, {7}}, msg_flags=0}, 0) = 6
  4. [pid 5350] fstat(7, {st_mode=S_IFREG|0600, st_size=217016, ...}) = 0
  5. [pid 5350] pread(7, "\1\0\0\0h\0\0\0D\254\0\0\1\0\0\0\250\305XP\0\0\0\0\323"..., 104, 0) = 104
  6. [pid 5350] mmap(NULL, 217016, PROT_READ, MAP_SHARED, 7, 0) = 0x2b646ca23000[pid 5350] close(7) = 0
  7. [pid 5350] close(6) = 0
  8. [pid 5350] getgid() = 501
  9. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_1.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  10. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_2.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  11. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_3.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  12. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_4.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  13. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_5.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  14. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_6.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  15. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_7.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = -1 EEXIST (File exists)
  16. ...
  17. [pid 5350] open("/u01/app/oracle/admin/bigb/adump/xxxxx_ora_5350_186.aud", O_RDWR|O_CREAT|O_EXCL, 0660) = 6
  18. [pid 5350] write(6, "Audit file ", 11) = 11
  19. [pid 5350] write(6, "/u01/app/oracle/admin/bigb/adump"..., 55) = 55
  20. [pid 5350] write(6, "\n", 1) = 1
  21. ...
  22. [pid 5350] write(6, "Thu Mar 12 11:37:08 2015 +01:00\n", 32) = 32
  23. [pid 5350] write(6, "LENGTH : \'160\'", 14) = 14
  24. [pid 5350] write(6, "\n", 1) = 1
  25. [pid 5350] write(6, "ACTION :[7] \'CONNECT\'\nDATABASE U"..., 159) = 159
  26. [pid 5350] write(6, "\n", 1) = 1
  27. [pid 5350] write(12, "\0\225\0\0\6\0\0\0\0\0\10\0\0\4\1\0\0\0\0\0\1\0\0\0\0\0"..., 149 <unfinished ...>
  28. [pid 5344] <... read resumed> "\0\225\0\0\6\0\0\0\0\0\10\0\0\4\1\0\0\0\0\0\1\0\0\0\0\0"..., 8208) = 149

可以看到,sqlplus用户进程的PID为5344(最后一行)。它从读取系统调用开始,并fork出影子进程 pid 5350。由于是使用sysdba权限登录,5350进程在登录到数据库之前必须在审核日志中进行记录。因此它在audit_trail目录中基于PID 5350扫描已有文件,找到可用的最大序号,使用最大序号创建新审计文件然后写入。很明显基于PID 5350的审计文件越多,这个操作越耗时。

二、 解决方法

找到了慢的原因,解决方法很容易想到。如果安全并不要求要这些日志,可以保留比如最近一个月三个月的数据,多余的删除。如果需要,可以定期将文件挪到别的目录,避免adump下文件过多。关于如何快速删除大量小文件,参考:linux删除大量文件的6种方法_Hehuyi_In的博客-CSDN博客_linux删除大量文件

三、 strace参数含义


  1. -c 统计每一系统调用的所执行的时间,次数和出错的次数等.
  2. -d 输出strace关于标准错误的调试信息.
  3. -f 跟踪由fork调用所产生的子进程.
  4. -ff 如果提供-o filename,则所有进程的跟踪结果输出到相应的filename.pid中,pid是各进程的进程号.
  5. -F 尝试跟踪vfork调用.在-f时,vfork不被跟踪.
  6. -h 输出简要的帮助信息.
  7. -i 输出系统调用的入口指针.
  8. -q 禁止输出关于脱离的消息.
  9. -r 打印出相对时间关于,,每一个系统调用.
  10. -t 在输出中的每一行前加上时间信息.
  11. -tt 在输出中的每一行前加上时间信息,微秒级.
  12. -ttt 微秒级输出,以秒了表示时间.
  13. -T 显示每一调用所耗的时间.
  14. -v 输出所有的系统调用.一些调用关于环境变量,状态,输入输出等调用由于使用频繁,默认不输出.
  15. -V 输出strace的版本信息.
  16. -x 以十六进制形式输出非标准字符串
  17. -xx 所有字符串以十六进制形式输出.
  18. -a column
  19. 设置返回值的输出位置.默认 为40.
  20. -e expr
  21. 指定一个表达式,用来控制如何跟踪.格式如下:
  22. [qualifier=][!]value1[,value2]...
  23. qualifier只能是 trace,abbrev,verbose,raw,signal,read,write其中之一.value是用来限定的符号或数字.默认的 qualifier是 trace.感叹号是否定符号.例如:
  24. -eopen等价于 -e trace=open,表示只跟踪open调用.而-etrace!=open表示跟踪除了open以外的其他调用.有两个特殊的符号 all 和 none.
  25. 注意有些shell使用!来执行历史记录里的命令,所以要使用\\.
  26. -e trace=set
  27. 只跟踪指定的系统 调用.例如:-e trace=open,close,rean,write表示只跟踪这四个系统调用.默认的为set=all.
  28. -e trace=file
  29. 只跟踪有关文件操作的系统调用.
  30. -e trace=process
  31. 只跟踪有关进程控制的系统调用.
  32. -e trace=network
  33. 跟踪与网络有关的所有系统调用.
  34. -e strace=signal
  35. 跟踪所有与系统信号有关的 系统调用
  36. -e trace=ipc
  37. 跟踪所有与进程通讯有关的系统调用
  38. -e abbrev=set
  39. 设定 strace输出的系统调用的结果集.-v 等与 abbrev=none.默认为abbrev=all.
  40. -e raw=set
  41. 将指 定的系统调用的参数以十六进制显示.
  42. -e signal=set
  43. 指定跟踪的系统信号.默认为all.如 signal=!SIGIO(或者signal=!io),表示不跟踪SIGIO信号.
  44. -e read=set
  45. 输出从指定文件中读出 的数据.例如:
  46. -e read=3,5
  47. -e write=set
  48. 输出写入到指定文件中的数据.
  49. -o filename
  50. 将strace的输出写入文件filename
  51. -p pid
  52. 跟踪指定的进程pid.
  53. -s strsize
  54. 指定输出的字符串的最大长度.默认为32.文件名一直全部输出.
  55. -u username
  56. 以username 的UID和GID执行被跟踪的命令

关于strace的其他使用案例,参考

Slow SQL*Plus Login | Oracle Database Blog: Experiments & Learnings

Linux strace命令 - ggjucheng - 博客园

https://blogs.oracle.com/database4cn/sqlplus

strace解决sqlplus登陆缓慢的问题一例_crc89714的博客-CSDN博客

实战例子:用strace分析数据库连接问题_记忆碎片的技术博客_51CTO博客

strace 解决 mysql 连接数据库总是定位/tmp/mysql.sock的问题_小鱼的技术博客_51CTO博客

文章知识点与官方知识档案匹配,可进一步学习相关知识
CS入门技能树Linux入门初识Linux32621 人正在系统学习中

[转帖]strace分析sqlplus登录慢问题的更多相关文章

  1. Win7下SQLPlus登录时报错"SP2-1503:无法初始化Oracle调用界面"

    Oracle安装完毕,使用SQLPlus登录的时候报错"SP2-1503:无法初始化Oracle调用界面",然后一闪界面关闭,报错界面如下: 这个是因为在Win7需要管理员权限,右 ...

  2. amazeui页面分析之登录页面

    amazeui页面分析之登录页面 一.总结 1.tpl命名空间:tpl命名空间的样式都是从app.css里面来的,app.css用用来移动网站开发的样式 2.表单样式:am-form到am-form- ...

  3. ORACLE中的Net Configuration Assistant 点击后无反应, sqlplus登录数据库提示Oracle11g ORA-12560: TNS: 协议适配器错误

    首先是对于点击无反应问题: 如果是客户端下的Net Configuration Assistant可用,而服务器端的Net Configuration Assistant等工具不可用的原因如下. 环境 ...

  4. sqlplus登录信息,列出所有表,列在表结构,sqlplus行和列显示设置,别名,Null值问题,细木工,DISTINCT

     1 sqlplus登录方式: 普通用户登录: 登录eg:C:\>sqlplusscott/11  (格式:sqlplus username/password) 退出eg:quit退出 超级 ...

  5. v75.01 鸿蒙内核源码分析(远程登录篇) | 内核如何接待远方的客人 | 百篇博客分析OpenHarmony源码

    子曰:"不学礼,无以立 ; 不学诗,无以言 " <论语>:季氏篇 百篇博客分析.本篇为: (远程登录篇) | 内核如何接待远方的客人 设备驱动相关篇为: v67.03 ...

  6. 通过sqlplus 登录数据库服务器

    点击“运行”,输入"sqlplus",弹出 , 再往里面输入账号scott,密码tiger 或者,点击“运行”,输入"sqlplus /nolog",此时只打开 ...

  7. sqlplus登录、连接命令

    经常使用: sqlplus username/password  如:普通用户登录  sqlplus scott/tiger sqlplus username/password@net_service ...

  8. strace 分析 跟踪 进程错误

    strace是什么? 按照strace官网的描述, strace是一个可用于诊断.调试和教学的Linux用户空间跟踪器.我们用它来监控用户空间进程和内核的交互,比如系统调用.信号传递.进程状态变更等. ...

  9. oracle之用户名密码包含特殊字符时候怎么使用sqlplus登录

    oracle有时候用户密码包含一些特殊字符直接登录会报错,需要使用以下方式登录sqlplus sqlplus 'username/"password"' PS:整体使用单引号括起来 ...

  10. sqlplus登录远程数据库与数据导出

    一.登录 1.cmd中输入sqlplus /nolog 2.链接数据库,root是用户名,root123是密码,ORCL是数据库名.conn root/root123@192.168.1.27:152 ...

随机推荐

  1. JavaFx之使用指定字体样式(二十九)

    JavaFx之使用指定字体样式(二十九) javafx use specified font 29 javafx默认的字体样式太丑,可能需要我们自定义字体样式. 之前说好放弃学习javafx,没想到越 ...

  2. ubuntu 之 go+/goplus 安装

    目前情况是要安装 goplus/go+ 之前 必须先安装 golang golang下载地址:https://golang.google.cn/dl/ 或者 https://studygolang.c ...

  3. 输入的查询SQL语句,是如何执行的?

    摘要:输入一条语句,返回一个结果,却不知道这条语句在 MySQL 内部的执行过程. 本文分享自华为云社区<一条查询SQL是如何执行的>,作者: 共饮一杯无 . 执行如下SQL,我们看到的只 ...

  4. 关于Spring注解开发教程,打包全送你

    摘要:spring是我们web开发中必不可少的一个框架,基于传统的xml方式配置bean总觉得太过繁琐,从spring2.5之后注解的出现可以大大简化我们的配置. 本文分享自华为云社区<如何高效 ...

  5. Windows系统快速安装Superset 0.37

    Windows系统安装Superset 0.37 Superset 是一款由 Airbnb 开源的"现代化的企业级 BI(商业智能) Web 应用程序",其通过创建和分享 dash ...

  6. 十大 CI/CD 安全风险(二)

    在上一篇文章中,我们主要介绍了 CI/CD 中流程控制机制不足和身份及访问管理不足两大安全风险,并为企业及其开发团队在缓解相应风险时给出了一些建议.今天我们将继续介绍值得企业高度关注的 CI/CD 安 ...

  7. Nacos 1.2.1 集群搭建(三) Nginx 配置 集群

    配置 Nginx 可以把.conf 文件拉到本地,配置好再传上去 #gzip on; upstream cluster{ server 192.168.0.113:8848; server 192.1 ...

  8. Mysql--编译安装5.6版本

    1 下载编译工具 yum -y install cmake gcc gcc-c++ ncurses-devel autoconf 2 创建用户 目录 useradd -s /sbin/nologin ...

  9. C# 32位程序申请大内存

    VS2015 项目-->属性-->生成事件 在"后期生成事件命令行"中输入: cd /d $(DevEnvDir) cd.. cd.. cd VC\bin editbi ...

  10. js将页面上取得的元素坐标转换为电脑屏幕坐标

    代码: <!DOCTYPE html> <html> <head> <title>计算屏幕坐标</title> <meta chars ...