- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
因此,我的 Sidekiq worker 出现了内存泄漏。我有一个工作服务器,只有一个队列用于这个工作任务,一周内达到大约 10G RSS。
我尝试只用 1 个工作线程在本地重现它,瞧 - 我在一晚上从 200M 增加到 1G,每分钟处理 1 个任务。自然地,我想知道泄漏了什么,所以我还记录了 RSS、heap_live_slots 和 heap_free_slots。当我绘制结果时,我可以看到稳定的 RSS增长同时live and free slots随机波动,但在定义明确且恒定的边界内,而它们的总和保持不变。
此时我得出的结论是,泄漏可能不是发生在 Ruby 代码中,而是发生在某些 native 扩展中。所以我通过 RVM 重新安装带有 Jemalloc 支持的 ruby:rvm 重新安装 2.4.2 --with-jemalloc
然后我设置MALLOC_CONF
:
导出
MALLOC_CONF='prof_leak:true,lg_prof_sample:0,prof_final:true,stats_print:true'
然后启动 Sidekiq。新启动的带有 1 个工作线程的 Sidekiq 值(value)大约 200M RSS,但是当我按下 Ctrl+C 并查看 jemalloc 的统计输出时,我看到了一些完全不同的东西:
Arenas: 32
Quantum size: 16
Page size: 4096
Maximum thread-cached size class: 32768
Allocated: 34056, active: 61440, metadata: 2949272, resident: 2981888, mapped: 6352896, retained: 2035712
什么? 6M映射?这不可能是真的。所以我启动 irb 并执行以下操作:
2.4.2 :001 > arr = []
=> []
2.4.2 :002 > loop do
2.4.2 :003 > arr << 'a'*10000000
2.4.2 :004?> sleep 1
2.4.2 :005?> end
等到 irb 进程攀升到大约 1G RSS 后,我停止了进程...并看到完全相同的数字。也许可视化调用图会帮助我了解发生了什么?
jeprof --show_bytes --pdf `which ruby` jeprof.10536.0.f.heap > ruby.pdf
Using local file /home/mhi/.rvm/rubies/ruby-2.4.2/bin/ruby.
Using local file jeprof.10536.0.f.heap.
No nodes to print
所以显然有些地方出了问题,这就是我需要帮助解决的问题。
这是 jemalloc stat 的完整输出:https://pastebin.com/RiMLtqA6
UPD。
所以我已经更新了所有与 native 扩展相关的 gem,这里是输出bundle exec ruby -e 'puts Gem.loaded_specs.values.select{ |i| !i.extensions.empty? }.map{ |i| "#{i.name} #{i.version}"}'
:
io-console 0.4.6
nokogiri 1.8.1
bcrypt 3.1.11
debug_inspector 0.0.3
binding_of_caller 0.7.2
json 2.1.0
capybara-webkit 1.14.0
damerau-levenshtein 1.3.0
unf_ext 0.0.7.4
eventmachine 1.2.5
ffi 1.9.18
kgio 2.11.0
msgpack 1.1.0
mysql2 0.4.9
rainbow 2.2.2
raindrops 0.18.0
rbtrace 0.4.8
stackprof 0.2.10
therubyracer 0.12.3
unicode 0.4.4.4
unicorn 5.3.0
相同的结果:RSS , Memory slots
最佳答案
Ruby 2.4.2 has a known issue with jemalloc
.
这个问题大约一个月前关闭了,但我不知道你使用的软件包是否打了补丁......实际上,我认为补丁还没有发布。很可能所有 jemalloc
统计数据都不相关。
此外,这似乎是一个 X-Y question (你问的是 jemalloc
,而你可能想要内存“泄漏”的解决方案)。
在假设 native 代码中存在内存泄漏(尽管可能性很大)之前,我会考虑任务的作用域如何影响垃圾收集器,并尝试最小化作用域和任何长期变量。
例如,如果您的任务是一个Proc
,它可能会绑定(bind)到全局范围,这意味着某些变量可能永远存在...
尝试将任务包含在一个函数中,并确保任务完成后没有引用任何变量。
关于ruby - 使用 jemalloc 调试 sidekiq worker 内存泄漏,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47220633/
我想使用 rails 控制台重新启动所有失败的作业。有没有办法做到这一点?我可以使用以下方法获取工作列表: require 'sidekiq/api' Sidekiq::Queue.new("mail
我想使用 Datadog 来监控一些后台作业的队列长度。 基本上我需要知道 Sidekiq 中代表队列的键的名称 ,以便我可以按照此处所述对其进行监控: https://docs.datadoghq.
我将 Sidekiq 与 Rails 一起使用,返回的并发值似乎是错误的。 Sidekiq.options[:concurrency] 返回 10 而不是 3,这是我的 config/sidekiq.
从Rails API中,我发现ActiveJob可以retry_job间隔: my_job_instance.enqueue my_job_instance.enqueue wait: 5.minut
我正在一个作业中进行一些处理,最终执行一个外部 shell 命令。该命令正在执行需要数小时才能完成的脚本。 问题是在我使用 spawn 启动脚本后和 detach如果我使用 kill -15 信号关闭
我有一个使用 Capistrano 部署的 Rails 3 应用程序。我最近添加了 Sidekiq。它在我的开发中运行良好。我同时主持 staging和 preview在同一台服务器上,它的预览无法正
我有一个简单的工作线程正在访问其自己的队列的大小: 需要“sidekiq/api” class TestWorker include Sidekiq::Worker def perform(*
我在我的 Rails 应用程序中使用 sidekiq。默认情况下,任何人都可以通过在 url 后附加“/sidekiq”来访问 Sidekiq。我只想用密码保护/验证 sidekiq 部分。我该怎么做
我正在在线阅读一些教程,这些教程告诉我们将 ActiveJob 与 Sidekiq 结合使用。但我不知道我们为什么要这样做。我看到 Sidekiq 具有 ActiveJob 的所有功能。 此外,在 S
我猴子修补了我的用户类(由设计支持)以像这样使用 ActiveJob: class User ActionMailer::DeliveryJob, :args=>["Devise::Mailer",
我有 sidekiq 作业对多种类型的资源进行处理。但是,对于特定类型的资源,例如:资源 X,我需要确保在任何给定时间只有一个 sidekiq 作业可以处理该特定资源。 例如,如果我有 3 个 sid
在过去的一年里,我对我的一项工作的流程进行了大量更改。诸如从相应模型上的 after_commit 而不是 after_create 触发它,以及清理逻辑和覆盖极端情况 我在我的 Heroku Rub
我看到this在 Sidekiq 官方 wiki 中,ActiveJob 会慢得多。 但它是在 2018 年 3 月根据此 issue 基于 Rails 4.2 和 Sidekiq 5.1.1 提到的
我使用 Rails 4 默认测试框架并编写了一些测试,这些测试也希望 Sidekiq 在“后台”做一些工作。但是当我运行 rake test 时,我的测试结果看起来像这样: .............
我们几周前在我们的系统中添加了监控用户事件,如下所示: class ApplicationController < ActionController::Base before_filter :lo
我正在运行 7 个 sidekiq 进程(货币设置为 40)和一个乘客网络服务器,连接到 postgres 数据库。 Rails 池设置设置为 100,postgres max_connectio
我第一次在 Rails 应用程序中使用 Sidekiq。这也是我第一次使用Redis。 我见过几个示例(Here、here、here),其中 initializers/sidekiq.rb 包含以下几
我刚开始使用 sidekiq 和 redis,我试图让 sidekiq 在 Heroku 上运行,但每次我部署 Rails 4 应用程序时它似乎都会崩溃。我在 Papertrail 中收到此错误: M
我有一个要求,我应该能够每秒运行 100 个 sidekiq 作业。 我将服务器容量增加到 8 个 CPU 并创建了 4 个 sidekiq 进程,但它仍然每分钟服务 50 个作业。 我不确定我在哪里
我在 Sidekiq 中有两种队列:“default/low”——满足网络请求和“background_queue”——运行后台进程,比如获取推文。我想在不同的 dyno 上运行“background
我是一名优秀的程序员,十分优秀!