golang 性能调优分析工具 pprof(下)
golang 性能调优分析工具 pprof(上)篇, 这是下篇。
四、net/http/pprof
4.1 代码例子 1
go version go1.13.9
把上面的程序例子稍微改动下,命名为 demohttp.go:
package main
import (
"bytes"
"fmt"
"io/ioutil"
"log"
"math/rand"
"net/http"
_ "net/http/pprof"
"sync"
)
func main() {
http.HandleFunc("/pprof-test", handler)
fmt.Println("http server start")
err := http.ListenAndServe(":8090", nil)
if err != nil {
log.Fatal(err)
}
}
func handler(resp http.ResponseWriter, req *http.Request) {
var wg sync.WaitGroup
wg.Add(200)
for i := 0; i < 200; i++ {
go cyclenum(30000, &wg)
}
wg.Wait()
wb := writeBytes()
b, err := ioutil.ReadAll(wb)
if err != nil {
resp.Write([]byte(err.Error()))
return
}
resp.Write(b)
}
func cyclenum(num int, wg *sync.WaitGroup) {
slice := make([]int, 0)
for i := 0; i < num; i++ {
for j := 0; j < num; j++ {
j = i + j
slice = append(slice, j)
}
}
wg.Done()
}
func writeBytes() *bytes.Buffer {
var buff bytes.Buffer
for i := 0; i < 30000; i++ {
buff.Write([]byte{'a' + byte(rand.Intn(10))})
}
return &buff
}
4.2 开始分析
4.2.1 在 web 界面上分析
先运行上面的 demohttp.go 程序,执行命令:
go run demohttp.go
然后在浏览器输入:http://localhost:8090/debug/pprof/,查看服务运行情况,如下图:

| 名称 | url | 说明 |
|---|---|---|
| allocs | $host/debug/pprof/allocs?debug=1 | 过去所有内存抽样情况 |
| block | $host/debug/pprof/block?debug=1 | 同步阻塞时程序栈跟踪的一些情况 |
| heap | $host/debug/pprof/heap?debug=1 | 活动对象的内存分配情况 |
| mutex | $host/debug/pprof/mutex?debug=1 | 互斥锁持有者的栈帧情况 |
| profile | $host/debug/pprof/profile | cpu profile,点击时会得到一个文件,然后可以用 go tool pprof 命令进行分析 |
| threadcreate | $host/debug/pprof/threadcreate?debug=1 | 创建新 OS 线程的堆栈跟踪情况 |
| trace | $host/debug/pprof/trace | 当前程序执行的追踪情况,点击时会得到一个文件,可以用 go tool trace 命令来分析这个文件 |
点击上面的链接,就可以查看具体的分析情况。
不断刷新网页,可以看到数据在不断变化。
4.2.2 命令行交互分析
在命令行上运行 demohttp.go 程序,执行命令:
go run demohttp.go
A. 分析 cpu profile
在开启另外一个命令行终端,执行如下命令:
go tool pprof http://localhost:8090/debug/pprof/profile?seconds=70

参数 seconds = 70:进行 70s 的数据样本采集,这个参数可以根据实际情况调整。
上面的命令执行后,会等待 70s , 然后才会进入命令交互界面,如上图
输入 top 命令:

大家发现没,其实与上面 runtime/pprof 在命令行交互时是一样的操作,可以参考上面的字段参数说明。
找出耗时代码部分,也可以用命令:list。
在 top 命令执行后,发现什么问题没?这个 top 命令显示的信息都是系统调用信息耗时,没有用户定义的函数。为什么?下面进行分析。
B. 分析 memory profile
执行命令:
go tool pprof http://localhost:8090/debug/pprof/heap
然后同样输入 top 命令查看函数使用情况,如下图:

其余的跟踪分析命令类似,就不一一分析了。
把上面在终端命令行下交互分析的数据进行可视化分析。
4.2.3 图形可视化分析
A. pprof 图形可视化
在前面可视化分析中,我们了解到可视化最重要有 2 步:1.采集数据 2.图形化采集的数据。
在上面第三节 runtime/pprof 中,进入终端命令行交互操作,然后输入 web 命令,就可以生成一张 svg 格式的图片,用浏览器可以直接查看该图片。我们用同样的方法来试一试。
- 输入命令:
go tool pprof http://localhost:8090/debug/pprof/profile?seconds=30
- 等待 30s 后输入
web命令
如下图:

果然生成了一个 svg 文件,在浏览器查看该图片文件,啥有用信息也没有,如下图:

为什么没有有用信息?前面有讲到过,没有用户访问 http server ,需要的程序没有运行,一直阻塞在那里等待客户端的访问连接,所以 go tool pprof 只能采集部分代码运行的信息,而这部分代码又没有消耗多少 cpu。
那怎么办?
一个方法就是用 http 测试工具模拟用户访问。这里用 https://github.com/rakyll/hey 这个工具。
安装 hey:
go get -u github.com/rakyll/hey
安装完成后,进行 http 测试:
hey -n 1000 http://localhost:8090/pprof-test
同时开启另一终端执行命令:
go tool pprof http://localhost:8090/debug/pprof/profile?seconds=120
等待 120s 后,采集信息完成,如下图:

输入 top 命令查看统计信息:

可以看到用户定义的一个最耗时函数是:main.cyclenum。如果要查看这个函数最耗时部分代码,可以用 list cyclenum 命令查看。
我们这里是要生成一张图片,所以输入 web 命令生成图片:

在浏览器上查看 svg 图片:

(图片较大,只截取了部分)
这张图完整的展示了 top 命令的信息。
B. web 可视化
执行命令:
go tool pprof -http=":8080" http://localhost:8090/debug/pprof/profile
同时开启另一终端执行测试命令:
hey -n 200 -q 5 http://localhost:8090/pprof-test
上面 go tool pprof 执行完成后,会自动在浏览器打开一个 http 地址,http://localhost:8080/ui/,如下图:

(截取部分图片)
这样就可以在web浏览器上查看分析数据了。
C. 火焰图
用 http 测试框架 hey 访问,命令为:
hey -n 200 -q 5 http://localhost:8090/pprof-test
在压测的同时开启另一终端执行命令:
go-torch -u http://localhost:8090
来生成火焰图。
运行命令时在终端输出了信息 :
Run pprof command: go tool pprof -raw -seconds 30 http://localhost:8090/debug/pprof/profile
可以看到 go-torch 的原始命令也是用到了 go tool pprof
上面这个命令默认生成了 torch.svg 的火焰图文件,如下:

(截取一部分图展示)
点击方块可以查看更详细信息:

参考
golang 性能调优分析工具 pprof(下)的更多相关文章
- golang 性能调优分析工具 pprof (上)
一.golang 程序性能调优 在 golang 程序中,有哪些内容需要调试优化? 一般常规内容: cpu:程序对cpu的使用情况 - 使用时长,占比等 内存:程序对cpu的使用情况 - 使用时长,占 ...
- Golang性能调优入门
如何利用golang自带的profile工具进行应用程序的性能调优,前一段时间我做的日志分析系统在线上遇到了一个问题,就是分任务的系统down机了,日志处理延迟了10几个小时,这个时候任务分发系统重启 ...
- 专题:性能调优之工具---perf
1. Linux Perf简介 1.1 Perf是什么 Perf 是内置于Linux 内核源码树中的性能剖析(profiling)工具.它基于事件采样原理,以性能事件为基础,支持针对处理器相关性能指标 ...
- Kafka性能调优分析-线上环境篇
一.背景介绍: 在平时的开发中,使用kafka来发送数据已经非常熟悉,但是在使用的过程中,其实并没有比较深入的探索kafka使用过程中 一些参数配置,带来的损失可能就是没有充分的发挥出kfka的优势, ...
- Java性能调优—— VisualVM工具基本使用及监控本地和远程JVM进程超详细使用教程
- .NET性能调优之一:ANTS Performance Profiler的使用
.NET性能调优系列文章 系列文章索引 .NET性能调优之一:ANTS Performance Profiler的使用 .NET性能调优之二:使用Visual Studio进行代码度量 .NET性能调 ...
- 一份 Tomcat 和 JVM 的性能调优经验总结!拿走不谢
Tomcat性能调优 找到Tomcat根目录下的conf目录,修改server.xml文件的内容.对于这部分的调优,我所了解到的就是无非设置一下Tomcat服务器的最大并发数和Tomcat初始化时创建 ...
- 【Java/Android性能优3】Android性能调优工具TraceView使用介绍
本文转自:http://blog.csdn.net/innost/article/details/9008691 在软件开发过程中,想必很多读者都遇到过系统性能问题.而解决系统性能问题的几个主要步骤是 ...
- 【Java/Android性能优2】Android性能调优工具TraceView介绍
本文参考:http://www.trinea.cn/android/android-traceview/ Android自带的TraceView堪比java的性能调优工具visualvm线程视图,可以 ...
随机推荐
- IoT & Raspberry Pi
IoT & Raspberry Pi https://www.raspberrypi.org/ https://www.raspberrypi.org/training https://pro ...
- HTML5 image rotate effect
HTML5 image rotate effect HTML5 实现旋转拨号键盘 简单的html中js实现图片中心旋转 https://download.csdn.net/download/q3168 ...
- learning free programming resources form top university of the world
learning free programming resources form top university of the world Harvard university https://www. ...
- 运行Chrome浏览器如何添加Options
原文档 Options Windows: 退出Chrome的所有正在运行的实例. 右键单击"Chrome"快捷方式 选择属性 在"目标:"行的末尾添加命令行标志 ...
- NGK全球启动大会圆满召开,一起预见区块链的美好未来!
NGK Global全球启动大会在高新技术产业区硅谷于美国当地时间11月25日圆满召开!这次会议邀请了星盟高管.NGK全球各大市场领导人.NGK生态产业代表等上百位嘉宾出席,此次会议持续了一个多小时, ...
- 记一个关于std::unordered_map并发访问的BUG
前言 刷题刷得头疼,水篇blog.这个BUG是我大约一个月前,在做15445实现lock_manager的时候遇到的一个很恶劣但很愚蠢的BUG,排查 + 摸鱼大概花了我三天的时间,根本原因是我在使用s ...
- Go 去找个对象吧
前言 我的读者中应该大部分都是 Java 从业者,不知道写 Java 这些年是否真的有找到对象? 没找到也没关系,总不能在一棵树上吊死,我们也可以来 Go 这边看看,说不定会有新发现. 开个玩笑,本文 ...
- Java 12 新特性介绍,快来补一补
Java 12 早在 2019 年 3 月 19 日发布,它不是一个长久支持(LTS)版本.在这之前我们已经介绍过其他版本的新特性,如果需要可以点击下面的链接进行阅读. Java 11 新特性介绍 J ...
- [计算机图形学]光栅化算法:DDA和Bresenham算法
目录 一.DDA 二.Bresenham 三.绘制图形 1. 绘制直线 2. 绘制圆 3. 绘制椭圆 一.DDA DDA算法是最简单的直线绘制算法.主要思想是利用直线的斜截式:\(y=kx+b\) 对 ...
- Django模型层2
目录 一.聚合查询 聚合函数 二.分组查询 利用group by进行分组查询 三.F与Q查询 1. F类 2. Q类 四.orm字段及参数 五.自定义char字段 六.orm中的事务操作 1. 什么是 ...