- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我编写了一个在我的每个 docker 容器中运行的 golang 应用程序。它使用 protobufs 通过 tcp 和 udp 相互通信,我使用 Hashicorp 的成员列表库来发现我网络中的每个容器。在 docker stats 上,我看到内存使用量呈线性增加,因此我试图在我的应用程序中查找任何泄漏。
因为它是一个持续运行的应用程序,我使用 http pprof 检查任何一个容器中的实时应用程序。我看到 runtime.MemStats.sys 是恒定的,即使 docker stats 是线性增加的。我的 --inuse_space 大约是 1MB 并且 --alloc_space 当然随着时间的推移不断增加。这是 alloc_space 的示例:
root@n3:/app# go tool pprof --alloc_space main http://localhost:8080/debug/pprof/heap
Fetching profile from http://localhost:8080/debug/pprof/heap
Saved profile in /root/pprof/pprof.main.localhost:8080.alloc_objects.alloc_space.005.pb.gz
Entering interactive mode (type "help" for commands)
(pprof) top --cum
1024.11kB of 10298.19kB total ( 9.94%)
Dropped 8 nodes (cum <= 51.49kB)
Showing top 10 nodes out of 34 (cum >= 1536.07kB)
flat flat% sum% cum cum%
0 0% 0% 10298.19kB 100% runtime.goexit
0 0% 0% 6144.48kB 59.67% main.Listener
0 0% 0% 3072.20kB 29.83% github.com/golang/protobuf/proto.Unmarshal
512.10kB 4.97% 4.97% 3072.20kB 29.83% github.com/golang/protobuf/proto.UnmarshalMerge
0 0% 4.97% 2560.17kB 24.86% github.com/hashicorp/memberlist.(*Memberlist).triggerFunc
0 0% 4.97% 2560.10kB 24.86% github.com/golang/protobuf/proto.(*Buffer).Unmarshal
0 0% 4.97% 2560.10kB 24.86% github.com/golang/protobuf/proto.(*Buffer).dec_struct_message
0 0% 4.97% 2560.10kB 24.86% github.com/golang/protobuf/proto.(*Buffer).unmarshalType
512.01kB 4.97% 9.94% 2048.23kB 19.89% main.SaveAsFile
0 0% 9.94% 1536.07kB 14.92% reflect.New
(pprof) list main.Listener
Total: 10.06MB
ROUTINE ======================== main.Listener in /app/listener.go
0 6MB (flat, cum) 59.67% of Total
. . 24: l.SetReadBuffer(MaxDatagramSize)
. . 25: defer l.Close()
. . 26: m := new(NewMsg)
. . 27: b := make([]byte, MaxDatagramSize)
. . 28: for {
. 512.02kB 29: n, src, err := l.ReadFromUDP(b)
. . 30: if err != nil {
. . 31: log.Fatal("ReadFromUDP failed:", err)
. . 32: }
. 512.02kB 33: log.Println(n, "bytes read from", src)
. . 34: //TODO remove later. For testing Fetcher only
. . 35: if rand.Intn(100) < MCastDropPercent {
. . 36: continue
. . 37: }
. 3MB 38: err = proto.Unmarshal(b[:n], m)
. . 39: if err != nil {
. . 40: log.Fatal("protobuf Unmarshal failed", err)
. . 41: }
. . 42: id := m.GetHead().GetMsgId()
. . 43: log.Println("CONFIG-UPDATE-RECEIVED { \"update_id\" =", id, "}")
. . 44: //TODO check whether value already exists in store?
. . 45: store.Add(id)
. 2MB 46: SaveAsFile(id, b[:n], StoreDir)
. . 47: m.Reset()
. . 48: }
. . 49:}
(pprof)
我已经能够使用 http://:8080/debug/pprof/goroutine?debug=1 验证没有 goroutine 泄漏发生
请评论为什么docker stats显示不同的图片(内存线性增加)
CONTAINER CPU % MEM USAGE / LIMIT MEM % NET I/O BLOCK I/O PIDS
n3 0.13% 19.73 MiB / 31.36 GiB 0.06% 595 kB / 806 B 0 B / 73.73 kB 14
如果我整夜运行它,内存会膨胀到大约 250MB。我没有运行它比这更长的时间,但我觉得它应该达到一个平台而不是线性增加
最佳答案
docker stats 显示来自 cgroups 的内存使用统计信息。 (引用:https://docs.docker.com/engine/admin/runmetrics/)
如果您阅读“过时但有用”的文档 (https://www.kernel.org/doc/Documentation/cgroup-v1/memory.txt),它会说
5.5 usage_in_bytes
For efficiency, as other kernel components, memory cgroup uses some optimization to avoid unnecessary cacheline false sharing. usage_in_bytes is affected by the method and doesn't show 'exact' value of memory (and swap) usage, it's a fuzz value for efficient access. (Of course, when necessary, it's synchronized.) If you want to know more exact memory usage, you should use RSS+CACHE(+SWAP) value in memory.stat(see 5.2).
Page Cache 和 RES 包含在 memory usage_in_bytes 中。所以如果容器有文件 I/O,内存使用统计会增加。但是,对于容器,如果使用量达到最大限制,它会回收一些未使用的内存。因此,当我向我的容器添加内存限制时,我可以观察到内存在达到限制时被回收和使用。除非没有内存可回收并且发生 OOM 错误,否则容器进程不会被终止。对于关心 docker stats 中显示的数字的任何人,简单的方法是检查路径中 cgroups 中可用的详细统计信息:/sys/fs/cgroup/memory/docker//这会在 memory.stats 或其他 memory.* 文件中详细显示所有内存指标。
如果您想在“docker run”命令中限制 docker 容器使用的资源,您可以按照以下引用资料进行操作:https://docs.docker.com/engine/admin/resource_constraints/
因为我使用的是 docker-compose,所以我通过在我的 docker-compose.yml 文件中我想限制的服务下添加一行来做到这一点:
mem_limit: 32m
其中 m 代表兆字节。
关于go - "Memory used"公制 : Go tool pprof vs docker stats,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41604669/
我不明白这个指标/规则的原因: A function should not be called from more than 5 different functions. All calls with
我正在尝试从 2D 图像对应关系重建 3D 点。我的相机已校准。测试图像是方格立方体,对应的是手工挑选的。消除了径向畸变。然而,经过三角测量后,构造似乎是错误的。 X 和 Y 值似乎是正确的,但 Z
我想知道我是否可以使用普罗米修斯数据中的“信息”(https://github.com/prometheus/client_python#info)指标在 grafana 中显示信息/数据。关于使用该
在h2o框架下实现MAPE的正确方法是什么? 我有兴趣将以下函数转换为 h2o 概念 def mape(a, b): mask = a <> 0 return (np.fabs(a -
我想知道用户首选的英里和米之间的单位是什么。似乎“Locale”类不允许这样做。 最佳答案 尽管无法使用 Locale 获取首选单位,但您可以默认假设 Locale 表示美国或缅甸 (locale.g
我正在尝试让 metric-fu 在我正在使用的 Rails 项目上运行。每次它运行我得到的指标的 rcov 部分时: ** Invoke metrics:all (first_time) ** Ex
我有一个 Spring Boot 应用程序,我正在使用 Spring Boot Actuator 和 Micrometer 来跟踪有关我的应用程序的指标。我特别关注“http.server.reque
我编写了一个在我的每个 docker 容器中运行的 golang 应用程序。它使用 protobufs 通过 tcp 和 udp 相互通信,我使用 Hashicorp 的成员列表库来发现我网络中的每个
我正在使用 spring boot 2.2.5 并通过 spring boot actuator 和 Grafana 监控我的应用程序指标。 我的应用程序使用 Docker(OpenJdk11) 打包
我是一名优秀的程序员,十分优秀!