接着上次的博客: https://www.cnblogs.com/ITPower/articles/12315637.html
pprof的基本操作,上次博客有记录,这里进一步研究pprof
1. pprof扩展
a. 在单元测试testing.B中测试检测程序的性能
b. web项目中检测程序的性能
2. pprof的使用,以及如何看生成的svg图.
3. 使用pprof分析近期做过的一个beego项目. 详见另一篇博客: https://www.cnblogs.com/ITPower/articles/12324659.html
4. 调研pprof是否能够使用在生成环境.
5. 研究testing.T,testing.B testing.TB testing.N的区别: 详见博客https://www.cnblogs.com/ITPower/articles/12320577.html
一. pprof扩展
Go语言自带了强大的性能测试工具pprof,位于 net/http 包下的 pprof, 官方文档
go中有pprof包来做代码的性能监控,在两个地方有包:net/http/pprof 和 runtime/pprof
其实net/http/pprof中只是使用runtime/pprof包来进行封装了一下,并在http端口上暴露出来.
- net/http/pprof : 可以做到直接看到当前 web 服务的状态,包括 cpu 占用情况和内存使用情况等。如果服务是一直运行的,如 web 应用,可以很方便的使用第一种方式 import "net/http/pprof"。
- runtime/pprof : 可以用来产生 dump 文件,再使用 Go Tool PProf 来分析这运行日志。
我们研究pprof的使用从两个方面研究 :
1. 如何查看单元测试中对性能的测试分析
2. 查看web服务的性能
1. 查看单元测试中对性能的测试分析
我们借用上一次的一个例子. 对异常处理的代码部分进行性能分析
第一步: 写性能分析的测试用例.
func BenchmarkWrapError(t *testing.B) { h := handlerUserError code := 400 message := "user error" for i := 0; i < t.N ; i ++ { f := WrapError(h) // 模拟Request和response response := httptest.NewRecorder() request := httptest.NewRequest(http.MethodGet,http://www.baidu.com",nil) f(response,request) 读取reponse返回的body b,_ := IoUtil.ReadAll(response.Body) body := strings.Trim(string(b),1)">\n) if code != response.Code || message != body { t.Errorf(except--code: %d,message: %s \n actual--code:%d,message:%s文件目录,在命令行执行 go test -bench . -cpuprofile cpu.out 性能测试cpu的消耗情况第三步: 执行pprof分析
go tool pprof cpu.out第四步: 输入web,会生成一个svg的文件,然后使用浏览器查看视图.
从图中可以看出每一步花费的时间大概是多少. 其中哪一个步骤花费的时间最长. 然后我们就可以针对其进行优化了
备注: 要想以web视图的方式查看上述结果,需要下载graphviz,下载方式参考https://www.cnblogs.com/ITPower/articles/12315637.html的第四点,附截图
2. 查看web服务的性能
第一步: import 增加net/http/pprof包
import( _ net/http/pprof )第二步: 打开http端的监听端口
go func() { http.ListenAndServe(localhost:8888页面
这个页面分为两部分. 第一部分是当前服务的使用情况. 第二部分,对命令的解析
使用情况截图如下
Count 表示当前服务使用数,比如2,是消耗内存的进程数. 21表示线程创建数,2 表示历史数据. 等等
Profile 是性能指标名
命令说明如下:
- allocs: 过去所有内存分配的样本
- block: 堆栈导致对原始同步的阻塞
- cmline: 当前程序的命令行调用
- goroutine: 当前所有goroutine的堆栈跟踪
- heap: 活动对象内存分配的采样。您可以指定gc GET参数以在获取堆样本之前运行GC。
- mutex: 竞争互斥持有人的堆栈痕迹
- profile: cpu配置文件。您可以在GET参数中指定持续时间。获取概要文件后,请使用go tool pprof命令调查文件。
- threadcreate: 导致创建新OS线程的堆栈跟踪
- trace: 当前程序执行的痕迹。您可以在GET参数中指定持续时间。获取跟踪文件后,使用go工具trace命令调查跟踪。
第四步: 通过Graphviz,查看heap
从图中看,cpu的使用是0,heap的使用是2,所以,我们查看heap.
go tool pprof http:127.0.0.1:8888/debug/pprof/heap
接下来我们可以通过help 查看pprof都有哪些命令. 常用的命令有. tree,top,web
我们用tree查看内存的使用情况
还可以使用top查看最消耗内存的地方
接下来还是使用web查看视图
视图更加直观,哪一步消耗了多少内存
第五步: 模拟并发,测试性能
这样的程序都是刚刚运行,所以内存消耗,cpu消耗都比较少. 接下来我们模拟大量请求,试一试性能如何
1. 下载一个模拟http请求的工具wrk(模拟现实,了解系统瓶颈,将服务器置于一个繁忙的状态,就像生产环境一样. ),下载地址: https://github.com/wg/wrk.git
在github上也有这个工具的介绍,
git clonehttps:github.com/wg/wrk.git cd wrk make备注: 整个操作参考github上的说明即可.
2. 安装好wrk以后,模拟批量请求
./wrk -c400 -t8 -d5m http:localhost:8899/v1/user/login
我模拟的是批量登录,参数含义如下
- -c400: 我们有400个连接可以保持打开状态
-t8
:意味着我们使用8个线程来构建请求-d5m
表示测试时间将持续5分钟3. 在浏览器输入
http:localhost:8899/debug/pprof/
查看使用情况
4. awk执行完以后,查看执行结果汇总
5. 接下来用go tool pprof 查看 heap
go tool pprof-alloc_space/-inuse_space
http:localhost:8899/debug/pprof/heap
-alloc_space: 过去使用的内存数据
-inuse_space: 正在使用的内存数据
返回的视图
方框越大,表示内存消耗越多.
参考文献:
1. https://blog.csdn.net/guyan0319/article/details/85007181