- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
来自Best Practices Guide对于使用 Sidekiq,我知道最好将“字符串、整数、 float 、 bool 值、null(nil)、数组和散列”作为参数传递给作业。
我通常只是将持久对象的 ID 传递给我的作业,但由于延迟限制,我需要在运行作业后保存该对象。
我正在使用的非持久化对象包含多种数据类型:
#MyObject<00x000>{
id: nil
start_time: Fri, 11 Dec 2020 08:45:00 PST -08:00 (*this is a TimeWithZone object)
rate: 18.0 (*this is a BigDecimal object)
...
}
我计划先将此对象转换为散列,然后将其传递给我的作业:
MyJob.perform_async(my_object.attributes)
然后像这样持久化对象:
MyObject.new(my_object_hash).save
我的问题是,这样安全吗?即使我将“简单”数据类型传递给 Sidekiq,它实际上包含复杂的对象。我会失去精度吗?
谢谢!
最佳答案
这听起来像是“potayto, potahto”解决方案。你不是不用Sidekiq的序列化,而是自己序列化。
让我们看看为什么 sidekiq 有这个规则:
Even if they did serialize correctly, what happens if your queue backs up and that quote object changes in the meantime? [...]Don't pass symbols, named parameters, keyword arguments or complex Ruby objects (like Date or Time!) as those will not survive the dump/load round trip correctly.
我想添加第三个:
Serializing state makes it impossible to distinguish between persisted and ethereal (in-memory, memoized, lazy-loaded etc) data. E.g. a
def sent_mails; @sent_mails ||= Mail.for(user_id: id); end
now gets serialized: do you want that?
sidekiq也提供了解决方案:
Don't save state to Sidekiq, save simple identifiers. Look up the objects once you actually need them in your perform method.
您的真正问题不是在何处或如何序列化状态。因为 sidekiq 警告不要序列化状态,无论您在何处以及如何执行此操作。
您需要解决的问题是如何将状态存储在可以正确存储的地方。或者根本避免存储状态:不在 redis/sidekiq 中,也不在给您带来问题的存储中。
您的存储速度慢吗?难道不是验证、序列化、缓慢的存储副作用吗?
您能否通过两步来改进它:插入状态并稍后更新/丰富/验证它异步?如果您使用的是 Rails,它在这里对您没有帮助,甚至可能对您不利,但一个常见的模型是将对象存储在一个特殊的“队列”表或事件队列中;例如kafka 以此闻名。
当例如存储通过慢速网络发生在慢速 API 上,这可能无法解决,但是当存储发生在本地数据库中时,您可以使用数十年的解决方案来提高写入性能。无论是在你的数据库中,还是在一些专门的状态存储队列中(sidekiq 不是这样一个专门的存储队列),这取决于用于存储的技术。例如。 Linux 将允许您通过内存进行存储,从而使写入磁盘的速度非常快,但无法保证它确实已写入磁盘。
例如在簿记 API 中,我们会将经过验证的对象存储在 PostgreSQL 中,然后让异步作业稍后为其添加昂贵的属性(例如,必须从遗留 API 或通过复杂计算检索的状态)。
例如在写入量大的 GIS 系统中,我们会将对象存储到“to_process_places”表中,该表由处理 Places 的工具监控。这完全取决于您的领域和要求。
一个常见的解决方案是不制作对象,而是使用客户的实际负载。只需发送 HTTP 有效负载(在 rails 中,params
)并保留它。也许合并到一个 header 中(如 Request Date )或过滤掉一些数据( header 标记或 cookie)。
如果您的 Controller 可以使用这些数据进行操作,那么延迟作业也可以。不要在 Controller 中构建对象,而是将其留给延迟的工作。这甚至可以产生真正整洁和精简的 Controller :它们所做的只是(一些身份验证和授权,然后)调用适当的作业并向其传递经过净化的 params
。
显然,这需要权衡,比如不能同步验证,而是通过电子邮件、推送通知或延迟响应提供此类信息,具体取决于您的要求(例如,大型 CSV 导入可以通过电子邮件发送任何验证问题,但如果登录无效,登录请求可能需要立即得到响应。
还需要考虑一下:您可能不想将 Base64 编码的 CSV 一起发送到 sidekiq,而是将文件写入(临时)存储并传递文件名/url。这听起来很明显,因为它是:文件上传本质上是前面提到的“临时状态存储”的实现:你不会将整个 PDF/high-res-header-image/CSV 传递给 sidekiq,而是存储它某个地方,这样 sidekiq 以后可以把它捡起来进行处理。如果将其他属性传递给 sidekiq 存在问题,为什么其他属性不采用相同的模式?
关于ruby-on-rails - 将复杂的哈希传递给 Sidekiq 作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65252608/
我想使用 rails 控制台重新启动所有失败的作业。有没有办法做到这一点?我可以使用以下方法获取工作列表: require 'sidekiq/api' Sidekiq::Queue.new("mail
我想使用 Datadog 来监控一些后台作业的队列长度。 基本上我需要知道 Sidekiq 中代表队列的键的名称 ,以便我可以按照此处所述对其进行监控: https://docs.datadoghq.
我将 Sidekiq 与 Rails 一起使用,返回的并发值似乎是错误的。 Sidekiq.options[:concurrency] 返回 10 而不是 3,这是我的 config/sidekiq.
从Rails API中,我发现ActiveJob可以retry_job间隔: my_job_instance.enqueue my_job_instance.enqueue wait: 5.minut
我正在一个作业中进行一些处理,最终执行一个外部 shell 命令。该命令正在执行需要数小时才能完成的脚本。 问题是在我使用 spawn 启动脚本后和 detach如果我使用 kill -15 信号关闭
我有一个使用 Capistrano 部署的 Rails 3 应用程序。我最近添加了 Sidekiq。它在我的开发中运行良好。我同时主持 staging和 preview在同一台服务器上,它的预览无法正
我有一个简单的工作线程正在访问其自己的队列的大小: 需要“sidekiq/api” class TestWorker include Sidekiq::Worker def perform(*
我在我的 Rails 应用程序中使用 sidekiq。默认情况下,任何人都可以通过在 url 后附加“/sidekiq”来访问 Sidekiq。我只想用密码保护/验证 sidekiq 部分。我该怎么做
我正在在线阅读一些教程,这些教程告诉我们将 ActiveJob 与 Sidekiq 结合使用。但我不知道我们为什么要这样做。我看到 Sidekiq 具有 ActiveJob 的所有功能。 此外,在 S
我猴子修补了我的用户类(由设计支持)以像这样使用 ActiveJob: class User ActionMailer::DeliveryJob, :args=>["Devise::Mailer",
我有 sidekiq 作业对多种类型的资源进行处理。但是,对于特定类型的资源,例如:资源 X,我需要确保在任何给定时间只有一个 sidekiq 作业可以处理该特定资源。 例如,如果我有 3 个 sid
在过去的一年里,我对我的一项工作的流程进行了大量更改。诸如从相应模型上的 after_commit 而不是 after_create 触发它,以及清理逻辑和覆盖极端情况 我在我的 Heroku Rub
我看到this在 Sidekiq 官方 wiki 中,ActiveJob 会慢得多。 但它是在 2018 年 3 月根据此 issue 基于 Rails 4.2 和 Sidekiq 5.1.1 提到的
我使用 Rails 4 默认测试框架并编写了一些测试,这些测试也希望 Sidekiq 在“后台”做一些工作。但是当我运行 rake test 时,我的测试结果看起来像这样: .............
我们几周前在我们的系统中添加了监控用户事件,如下所示: class ApplicationController < ActionController::Base before_filter :lo
我正在运行 7 个 sidekiq 进程(货币设置为 40)和一个乘客网络服务器,连接到 postgres 数据库。 Rails 池设置设置为 100,postgres max_connectio
我第一次在 Rails 应用程序中使用 Sidekiq。这也是我第一次使用Redis。 我见过几个示例(Here、here、here),其中 initializers/sidekiq.rb 包含以下几
我刚开始使用 sidekiq 和 redis,我试图让 sidekiq 在 Heroku 上运行,但每次我部署 Rails 4 应用程序时它似乎都会崩溃。我在 Papertrail 中收到此错误: M
我有一个要求,我应该能够每秒运行 100 个 sidekiq 作业。 我将服务器容量增加到 8 个 CPU 并创建了 4 个 sidekiq 进程,但它仍然每分钟服务 50 个作业。 我不确定我在哪里
我在 Sidekiq 中有两种队列:“default/low”——满足网络请求和“background_queue”——运行后台进程,比如获取推文。我想在不同的 dyno 上运行“background
我是一名优秀的程序员,十分优秀!