python - Redis 使用的 RAM 不足-6ren

python - Redis 使用的 RAM 不足

转载作者：IT王子更新时间：2023-10-29 01:50:20

31

4

我正在使用 Go 和 Redis 开发 API。问题是RAM使用不足，我找不到问题的根源。

TL;DR 版本

有数百/数千个哈希对象。每个 1 KB 的对象(键+值)占用大约 0.5 MB 的 RAM。但是，没有内存碎片(INFO 显示没有)。

此外，dump.rdb 比 RAM 集小 70 倍(对于 50 个对象，360KB dump.rdb 与 25MB RAM，对于 5000 个对象，35.5MB 与 2.47GB)。

长版

Redis 实例主要由以下类型的 task:123 哈希填充:

    "task_id"       : int
    "client_id"     : int
    "worker_id"     : int
    "text"          : string (0..255 chars)
    "is_processed"  : boolean
    "timestamp"     : int
    "image"         : byte array (1 kbyte)

此外，还有几个整数计数器、一个列表和一个排序集(均由 task_id 组成)。

RAM 使用量与任务对象的数量呈线性相关。

50 个任务的 INFO 输出:

# Memory
used_memory:27405872
used_memory_human:26.14M
used_memory_rss:45215744
used_memory_peak:31541400
used_memory_peak_human:30.08M
used_memory_lua:35840
mem_fragmentation_ratio:1.65
mem_allocator:jemalloc-3.6.0

和 5000 个任务:

# Memory
used_memory:2647515776
used_memory_human:2.47G
used_memory_rss:3379187712
used_memory_peak:2651672840
used_memory_peak_human:2.47G
used_memory_lua:35840
mem_fragmentation_ratio:1.28
mem_allocator:jemalloc-3.6.0

50 个任务的 dump.rdb 大小为 360kB，5000 个任务的大小为 35553kB。

每个任务对象的序列化长度约为 7KB:

127.0.0.1:6379> DEBUG OBJECT task:2000
Value at:0x7fcb403f5880 refcount:1 encoding:hashtable serializedlength:7096 lru:6497592 lru_seconds_idle:180

我已经编写了一个 Python 脚本来尝试重现该问题:

import redis
import time
import os 
from random import randint

img_size = 1024 * 1 # 1 kb
r = redis.StrictRedis(host='localhost', port=6379, db=0)

for i in range(0, 5000):
    values = { 
        "task_id"   : randint(0, 65536),
        "client_id" : randint(0, 65536),
        "worker_id" : randint(0, 65536),
        "text"      : "",
        "is_processed" : False,
        "timestamp" : int(time.time()),
        "image"     : bytearray(os.urandom(img_size)),
    }
    key = "task:" + str(i)
    r.hmset(key, values)
    if i % 500 == 0: print(i)

而且它只占用 80MB 内存!

如果有任何关于如何弄清楚发生了什么的想法，我将不胜感激。

最佳答案

您有很多很多小的 HASH 对象，这很好。但是它们中的每一个在redis内存中都有很多开销，因为它有一个单独的字典。对此有一个小的优化，通常可以显着改善事情，它将哈希保存在内存优化但稍慢的数据结构中，在这些对象大小下这应该无关紧要。从配置:

# Hashes are encoded using a memory efficient data structure when they have a
# small number of entries, and the biggest entry does not exceed a given
# threshold. These thresholds can be configured using the following directives. 
hash-max-ziplist-entries 512
hash-max-ziplist-value 64

现在，您的值很大，导致此优化不起作用。我将 hash-max-ziplist-value 设置为几 kbs(取决于最大对象的大小)，它应该会改善这一点(你不应该看到这个 HASH 大小有任何性能下降).

此外，请记住，redis 会根据您在内存中的内容压缩其 RDB 文件，因此无论如何预计会比内存减少约 50%。

[EDIT] 在重新阅读你的问题并发现它只是一个 go only 问题之后，考虑到压缩的 rdb 很小这一事实，有些东西告诉我你写的比你写的更大期待图像。您是否有可能将其从 []byte slice 中删除？如果是这样，也许您没有修剪它并且您正在编写一个更大的缓冲区或类似的东西？我已经像这样使用 redigo 进行了大量工作，但从未见过您所描述的内容。

关于python - Redis 使用的 RAM 不足，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30440144/

31

4

0

文章推荐： json - 不同类型反射的 Golang JSON 数组 : float64 vs int64

文章推荐： xml - 如何格式化solr结果文件？

文章推荐： regex - 如何在 golang 中使用正则表达式获取 url 模式？

ram - 计算机如何直接访问 RAM 中的内存位置？
如果我们想访问数组的元素 i，我们会这样做:i *(每个元素的大小)+ 数组的起始地址 = 我们需要访问的元素的内存位置。然后 CPU 直接访问 RAM 中的该位置。这是怎么发生的？假设我要定位的内
python 没有足够的 RAM 使用磁盘空间而不是 RAM
考虑以下 python 代码 with open(sys.argv[2], 'r') as fin, \ open(sys.argv[3], 'w') as fout:
Java 进程使用的 RAM 多于分配的 RAM？
基本上我在 Centos 6.2 16GB 系统上运行我的世界服务器我通过 rtoolkit 引导来启动我的服务器，现在我分配它使用 12GB，但它使用的 muc 比这多，我不知道为什么。我运行此命
c - 内存映射显示的 RAM 多于物理可用的 RAM
我正在开发一个小型 x86 内核。我正在访问并尝试读取 GRUB 在多重引导 header 中提供的内存映射。我有一个 Intel i3 cpu 和 4 GiB 的 RAM。在这台机器上运行时，我正在
ram - 限制 CPP 应用程序的 RAM 使用
我有 3 GB 内存。有没有办法只为 C++ 应用程序分配 512MB 的 RAM？否则有没有办法暂时将我的 RAM 减少到 512MB 以进行测试？谢谢，阿肖克最佳答案使用SetProce
c - DMA 传输 RAM 到 RAM
我的一个 friend 告诉我，在 x86 架构上，DMA Controller 无法在两个不同的 RAM 位置之间传输。它只能在RAM和外设(如PCI总线)之间传输。这是真的吗？因为 AFAIK
c - 分配 ram 显示任务管理器中 ram 使用量的两倍
做一些分析(内存和速度) 我一直被 win7 似乎分配的 RAM 正好是我要求的两倍这一事实所困扰...注意这是我第一次在 win7 上进行这样的主动分析，所以我真的不知道会发生什么。我在 win7
java - 如何复制正在运行的应用程序的 RAM，保存它，然后将其重新加载到 RAM 中？
我经常玩 retrofit 版的 Minecraft。这样做的一个缺点是，每当我启动 Minecraft 时，编译所有模组都需要花费大量时间。这可能需要大约 15 分钟左右的时间，在我看来，这太长了。
linux - 如何通过 DMA 将数据从 RAM 传输到 RAM？
我想编写一个内核模块，可以通过 DMA 将数据从 RAM 传输到 RAM。有一些帖子讨论这个，但我真的不明白。有人说可能，也有人说不可能。如果我对 ldd3 的理解是正确的，RAM 到 RAM 的复
powershell - 单值 Total Ram/Free Ram 可用内存/总内存
我正在寻找一种方法来查找总内存和正在使用的内存的单个熟值输出。 gwmi Win32_OperatingSystem | select TotalVisibleMemorySize, FreePhys
postgresql - 用于缓存的 Heroku Postgres RAM 与 Memcache RAM
我在 Heroku 上有一个网络应用程序，我试图了解添加具有 1GB RAM 的 Memcached 实例与向我的 Postgres 服务器添加 1GB RAM 之间的区别/权衡。如果我添加一个 M
python - 我需要通过将 Python 字典存储在硬盘驱动器而不是 RAM 中来释放 RAM。是否可以？
在我的例子中，我有一个包含大约 6000 个实例化类的字典，其中每个类都有 1000 个属性变量，所有类型都是字符串或字符串列表。当我建立这本字典时，我的 RAM 变得非常高。有没有一种方法可以在将字
c++ - 如果你已经消耗了所有的视频 ram，SDL Texture 会自动使用普通 Ram 吗？
我的问题是:如果您用完了所有可用的视频内存，并尝试创建新纹理 (SDL)，是否会自动使用普通内存而不是视频内存？或者，您是否必须尝试使用使用普通 ram 的表面 (SDL)？如果您出于任何原因无法
c - 当 ram 地址存储为 u32 时从 ram 内存中获取值
我在从 ram 地址获取值时遇到问题。我有一些限制，即它必须是 C 代码，并且存储信息的地址由 u32 值给出，例如 0x001c0080。环境是ARM的，我用的是eclipse sdk。我怎样才
linux - 如果 2GB RAM 可以使用虚拟内存完成工作，则需要 8GB RAM
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。这个问题似乎不是关于 a specific programming problem, a software
c - 区域 ram 溢出，section .text 不适合区域 ram
我正在尝试使用 GCC 编译器(标准 C)编译裸机应用程序。我使用 Cyclone V SoC 和 Cortex-A9 处理器。 eclipse DS-5。我收到这些错误 - “Region ram
python - 如果 RAM 不是问题，是逐行读取更快还是将所有内容读入 RAM 并访问它？ - Python
如果 RAM 不是问题(我的服务器上有接近 200GB)，是逐行读取更快还是将所有内容读入 RAM 并访问它？每行将是大约 200-500 个 unicode 字符的字符串。每个文件有近 200 万行
大 RAM 机器上的 pandas 内存错误但小 RAM 机器上没有 : same code, 相同的数据
我在我的两台机器上运行以下命令: import os, sqlite3 import pandas as pd from feat_transform import filter_anevexp db
c++ - 将数组从 RAM 复制到 GPU 以及从 GPU 复制到 RAM
我正在尝试在我的一个项目中引入一些 CUDA 优化。但我认为我在这里做错了什么。我想实现一个简单的矩阵 vector 乘法 (result = matrix * vector)。但是当我想将结果复制回
c++ - 为什么我的程序设计为耗尽 RAM 和 CPU 而没有使用所有 RAM 和 CPU？
#include #include #include #include #include #include using namespace std; char randomLetter()

首页

博学

6Ren·AI

商城

python - Redis 使用的 RAM 不足