python - Redis 队列 + python-rq : Right pattern to prevent high memory usage?-6ren

python - Redis 队列 + python-rq : Right pattern to prevent high memory usage?

转载作者：IT王子更新时间：2023-10-29 05:55:20

24

4

我们目前正在将 Redis 与我们的 Heroku 托管的 Python 应用程序一起使用。

我们将 Redis 与 python-rq 纯粹用作任务队列，以提供延迟执行一些时间密集型任务。一项任务是从 PostgreSQL 数据库中检索一些数据并将结果写回它 - 因此 Redis 实例中根本没有保存任何有值(value)的数据。我们注意到，根据执行的作业量，Redis 正在消耗越来越多的内存(增长速度约为 10 MB/小时)。 CLI 上的 FLUSHDB 命令修复了这个问题(将其减少到 ~700kB 使用的 RAM)直到 RAM 再次满。

根据我们(未更改的标准)设置，作业结果保留 500 秒。随着时间的推移，一些作业当然会失败，它们会被移到失败队列中。

我们必须采取哪些不同的措施才能使用稳定数量的 RAM 完成任务？
RAM 消耗从何而来？
我可以完全关闭持久性吗？
从文档中我知道 500 秒 TTL 意味着 key 随后“过期”，但并未真正删除。此时 key 是否仍然消耗内存？我能以某种方式改变这种行为吗？
它是否与失败的队列有关(它显然没有附加到作业的 TTL，这意味着(我认为)这些作业将永远保留)？
只是好奇:当纯粹将 RQ 用作队列时，Redis DB 中保存了什么？它是实际的可执行代码还是只是对可以找到要执行的函数的位置的引用？

很抱歉问了一些非常菜鸟的问题，但我对排队这个话题还很陌生，在研究了 2 天多之后，我已经到了不知道下一步该做什么的地步。谢谢，KH

最佳答案

又折腾了两天，发现问题所在。我想与您分享这个以及有用的工具:

核心问题

实际问题是我们忽略了在将对象保存到 PostgreSQL 数据库之前将其转换为字符串。如果没有这个转换，字符串表示最终会出现在数据库中(由于相应对象的 __str__() 函数返回我们想要的表示)；然而，对于 Redis，整个对象被传递了。将其传递给 Redis 后，相关任务崩溃并显示 UnpickleError异常(exception)。这消耗了崩溃后未释放的 5 MB RAM。

其他操作

为了进一步减少内存占用，我们实现了以下补充操作(请注意，我们将所有内容保存到单独的数据库中，因此 Redis 保存的结果根本不会在我们的应用程序中使用):

我们通过调用 enqueue_call([...] result_ttl=0) 将任务结果的 TTL 设置为 0
我们定义了一个自定义异常处理程序 - black_hole - 接受所有异常并返回 False。这可以防止 Redis 将任务移动到失败的队列，在那里它仍然会使用一些内存。异常情况会事先通过电子邮件发送给我们以进行跟踪。

一路走来的有用工具:

我们刚刚使用了 redis-cli .

redis-cli info | grep used_memory_human --> 显示当前内存使用情况。比较任务执行前后内存占用的理想选择。
redis-cli keys '*' --> 显示所有当前存在的键。这个概述让我了解到有些任务没有被删除，即使它们应该被删除(如上所述，它们因 UnpickleError 而崩溃，因此没有被删除)。
redis-cli monitor --> 显示 Redis 中发生的事情的实时概览。这帮助我发现来回移动的物体太大了。
redis-cli debug object <key> --> 显示键值的转储。
redis-cli hgetall <key> --> 显示键值的可读性更高的转储(对于将 Redis 纯粹用作任务队列的特定用例特别有用，因为任务似乎是由 python-rq 以这种格式创建的。

此外，我可以回答我上面发布的一些问题:

From the docs I know that the 500 sec TTL means that a key is then "expired", but not really deleted. Does the key still consume memory at this point? Can I somehow change this behavior?

实际上，正如文档所暗示的那样，它们已被删除。

Does it have something to do with the failed queue (which apparently does not have a TTL attached to the jobs, meaning (I think) that these are kept forever)?

令人惊讶的是，Redis 本身崩溃的作业并没有移到失败队列中，它们只是被“放弃”了，这意味着值仍然存在，但 RQ 并不像处理失败作业那样关心它。

相关文档

Redis 命令:http://redis.io/commands
python-rq 中的“黑洞”异常处理程序和 request_ttl:http://python-rq.org/docs/

关于python - Redis 队列 + python-rq : Right pattern to prevent high memory usage?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21270783/

24

4

0

文章推荐： django - 使用 Redis 作为 REST API 的中间缓存

文章推荐： javascript - Jquery 1.9，JS - 函数未在 Chrome 中定义

文章推荐： JavaScript 作用域被改变了？为什么会这样？

文章推荐： autocomplete - 如何使用 Redis ZRANGEBYLEX 模拟自动完成搜索？

memory - 在什么情况下我们可以使用Non-shareable device memory，或者Shareable device memory？
在 ARM 中，内存类型指定为: 正常设备强烈有序在Device type里面，好像这个类型也可以区分不可共享的设备内存可共享设备内存不可共享和可共享设备内存有什么区别？我们如何分别使用这
memory - 在什么情况下我们可以使用Non-shareable device memory，或者Shareable device memory？
在 ARM 中，内存类型指定为: 正常设备强烈有序在Device type里面，好像这个类型也可以区分不可共享的设备内存可共享设备内存不可共享和可共享设备内存有什么区别？我们如何分别使用这
memory - spark.python.worker.memory 与 spark.executor.memory 有何关系？
This diagram很清楚不同YARN和Spark内存相关设置之间的关系，除了spark.python.worker.memory。 spark.python.worker.memory 如何适应
memory - GLSL编译错误 “memory exhausted”
我正在尝试使用复杂的if-else决策树来实现GLSL片段着色器。不幸的是，着色器编译器很早就失败，并出现“语法错误-内存耗尽”错误。 GLSL中的代码大小或决策树深度是否有任何限制？有什么建议如何克
memory - 什么是 "tagged memory"？
什么是“标记内存”，它如何帮助减小程序大小？最佳答案您可能指的是 tagged union ，或更具体地说是硬件实现，如 LISP 机器中使用的标记架构。基本上是一种存储具有类型信息的数据的方法。
memory - 戈朗 : trouble with memory
我的内存有问题。我不明白为什么当我的程序长时间运行时 Go 使用越来越多的内存(从不释放它)。第一次分配后，程序使用了将近 9 MB 的内存。然后在 12 小时后，它开始以指数方式使用更多内存，直到
memory - mac上的matlab "memory"函数？
在 Windows 机器上，MATLAB 用户可以使用 memory或 feature memstats命令。但是，这些都不能在机器上工作，失败如下: >> memory??? Error using
memory-management - Linux 内核启动 : how is memory allocation done when DTB and initramfs are initially in memory?
引导 Linux 内核时，可以在 RAM 中加载 initramfs 存档和 DTB 文件，并将这些物理地址指定给内核。例如，使用 U-Boot，您可以执行以下操作: bootz 0x80008000
memory - 既然现代计算机都使用了虚拟内存，为什么还会遇到 "out of memory"问题呢？
我正在学习虚拟内存的概念，但是这个问题让我困惑了一段时间。由于大多数现代计算机都使用虚拟内存，因此当程序正在执行时，操作系统应该在 RAM 和磁盘之间将数据分页进出。但为什么我们仍然遇到“内存不足”的
memory - RuntimeError : CUDA out of memory. 如何设置max_split_size_mb？
我在 Colab Pro+(使用高 RAM 选项)上运行神经网络时发现了这个问题。运行时错误:CUDA 内存不足。尝试分配 8.00 GiB(GPU 0；15.90 GiB 总容量；12.04 Gi
memory - 为什么从 Memory & I\O 获取数据很昂贵？
当我在任何地方阅读基于操作系统的书籍时，考虑到时间限制和开销很高，从内存和 I\O(子系统)获取数据是昂贵的，这就是为什么在某些硬件制造商中提供一些其他方式来访问它们，如ARM7 some ISAs像
memory-management - 优势数据库服务器 : in-memory queries
据我所知，ADS v.10 尝试将查询结果保留在内存中，直到它变得非常大。对于 __output 表和临时表也应该如此。当结果变大时，交换声明。问题是为查询、 worker 等设置了什么内存限制？可
memory - Docker 的 --memory 开关无法按预期工作
序言我正在写一个小演示文稿来列出使用 Docker 时的一些“陷阱”，我也遇到了自己的一个问题。在解释让 Docker 在没有内存限制的情况下运行的危险时，我发现它的行为不像我预期的那样。我使用
memory - Web服务器容量规划: more cores versus more memory
我们有一个 ASP.NET 项目(40 个左右的 Web 表单、50 个表、相当标准的 IO 内容，并尽可能减少)，很快需要部署。系统上大约有 100 个并发用户，但任何时候只有大约 20 个用户在使
memory-leaks - 如何修复Redis "memory leak"
我在 dotcloud 上使用 redis 内存存储，但尽管 key 已过期，但它的 used_memory 再也不会下降。从 redis-cli 使用 flushdb 或 flushall 不会导致
xcode - 使用 Xcode Memory Graph Debugger 时出现 "Memory Graph Debugger: no serialized memory graph received from LeakAgent"错误
我使用的是 Xcode 10.2.1 和 macOS Catalina Developer Beta 2。每当我尝试使用内存图调试器时，我都会收到此错误: Memory Graph Debugger:
memory-leaks - 如何修复 D "memory leaks"
所以我一直在寻找这个问题的解决方案有一段时间了。我编写了一个程序来从两个单独的文本文件中获取数据，对其进行解析，然后输出到另一个文本文件和一个 ARFF 文件以供 Weka 分析。我遇到的问题是我编写
memory - erlang:memory() 与 memsup:get_system_memory_data()
对不起，我对 erlang 文档中的以下描述不太清楚: erlang:memory() -> [{Type, Size}] with Type: "total" means: "The total a
memory - 在以太坊 Solidity 中， "memory"关键字的用途是什么？
在查看示例合约时，有时会在带有“内存”的方法中声明数组，有时则不会。有什么区别？最佳答案如果没有内存关键字，Solidity会尝试在存储中声明变量。首席 Solidity 开发者 chriset
MATLAB 帕福尔 : memory management: shared memory or not?
我不明白Matlab并行计算工具箱中的parfor cicle是如何与内存一起工作的:我读到它在所有worker之间共享内存(然后我认为每个worker(核心)都可以访问感兴趣的内存位置而无需制作本地

首页

博学

6Ren·AI

商城

python - Redis 队列 + python-rq : Right pattern to prevent high memory usage?