- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我一直在使用和修改这个库 https://github.com/sile/patricia_tree
有点困扰的一件事是在 node.rs 中使用了多少不安全,特别是,它被定义为只是指向某个堆位置的指针。在执行自述文件页面(维基百科输入)上列出的第一个基准测试时,PatriciaSet 使用 ~700mb(PatriciaSet 只是在它的根目录下保存一个节点)
pub struct Node<V> {
// layout:
// all these fields accessed with ptr.offset
// - flags: u8
// - label_len: u8
// - label: [u8; label_len]
// - value: Option<V>
// - child: Option<Node<V>>
// - sibling: Option<Node<V>>
ptr: *mut u8,
_value: PhantomData<V>,
}
并使用
malloc
分配:
let ptr = unsafe { libc::malloc(block_size) } as *mut u8;
有人告诉我这个内存没有正确对齐,所以我尝试添加新的 alloc api 并使用 Layout/alloc,这也仍然没有正确对齐,只是似乎“工作”。
full pr
let layout = Layout::array::<u8>(block_size).expect("Failed to get layout");
let ptr = unsafe { alloc::alloc(layout) as *mut u8 };
这个单一的变化,它也持有
layout
在
ptr
指向的内存块中,在非常大的树的性能测试下,导致内存消耗增加了 40%。布局类型只有 2 个字宽,所以这是出乎意料的。对于相同的测试,这使用接近〜1000mb(与之前的700相比)
pub struct Node<V> {
value: Option<V>,
child: Option<*mut Node<V>>,
sibling: Option<*mut Node<V>>,
label: SmallVec<[u8; 10]>,
_value: PhantomData<V>,
}
以您可能期望使用rust 的方式创建节点
let child = child.map(|c| Box::into_raw(Box::new(c)));
let sibling = sibling.map(|c| Box::into_raw(Box::new(c)));
Node {
value,
child,
sibling,
label: SmallVec::from_slice(label),
_value: PhantomData,
}
性能方面,它大约相当于原始未修改的库,但它的内存消耗似乎并不比仅在 HashSet 中插入每个项目好多少,第一个基准测试使用约 1700mb。
Node
的结构之外,没有其他代码被更改。以及一些惯用地脱离这些变化的方法的实现。
最佳答案
您看到内存使用量增加的原因有两个。我将假设一个标准的 64 位 Unix 系统。
首先,一个指针是 8 个字节。一个 Option<*mut Node<V>>
是 16 个字节,因为指针不受引用发生的可空优化的影响。引用永远不能为空,因此编译器可以转换 Option<&'a V>
如果值为 None
,则转换为空指针如果是 Some
,则为常规指针,但指针可以为空,因此这里不会发生。 Rust 使枚举字段的大小与数据类型的大小相同,因此在这里每个指针使用 16 个字节。
处理这个问题的最简单和最安全的方法就是使用 Option<NonNull<Node<V>>>
.这样做会使您的结构总共减少 16 个字节。
二、您的SmallVec
大小为 32 字节。在某些情况下,它们避免需要堆分配,但尽管名称如此,它们并不一定很小。您可以使用常规 Vec
或盒装切片,这可能会以额外分配为代价降低内存使用率。
通过这些更改并使用 Vec
,您的结构将是 48 字节大小。对于盒装切片,它将是 40。原来使用的是 72。您看到的节省多少取决于您的标签有多大,因为您需要为它们分配空间。
此结构所需的对齐是 8 个字节,因为任何类型(指针)的最大对齐是 8 个字节。即使在 x86-64 这样的架构上,所有类型都不需要对齐,它仍然更快,有时甚至更快,所以编译器总是这样做。
原始代码根本没有正确对齐,要么完全失败(在 SPARC 上),要么性能很差(在 PowerPC 上),要么如果启用(在 MIPS 上)需要在内核中设置对齐陷阱,或者如果没有则失败.内核中的对齐陷阱用于非对齐访问的性能非常糟糕,因为您必须执行完整的上下文切换才能加载和移动两个单词,因此大多数人将其关闭。
这没有正确对齐的原因是因为 Node
包含一个指针,它出现在结构中的偏移量不能保证是 8 的倍数。如果它被重写为 child
和 sibling
属性首先出现,然后如果内存适当对齐(malloc
保证但您的 Rust 分配没有),它将正确对齐。您可以创建一个合适的 Layout
与 Layout::from_size_align(block_size, std::mem::align_of::<*mut Node>())
.
因此,虽然原始代码在 x86-64 上运行并节省了大量内存,但它的性能很差并且不可移植。
我在这个例子中使用的代码如下,加上一些关于 Rust 如何处理可空类型的知识以及关于 C 和内存分配的知识:
extern crate smallvec;
use smallvec::SmallVec;
use std::marker::PhantomData;
use std::ptr::NonNull;
pub struct Node<V> {
value: Option<V>,
child: Option<NonNull<Node<V>>>,
sibling: Option<NonNull<Node<V>>>,
label: Vec<u8>,
_value: PhantomData<V>,
}
fn main() {
println!("size: {}", std::mem::size_of::<Node<()>>());
}
关于memory - Rust - 为什么 malloc/alloc 和更多 'idiomatic' 方法之间的内存使用差异如此之大,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62725054/
我在具有 2CPU 和 3.75GB 内存 (https://aws.amazon.com/ec2/instance-types/) 的 c3.large Amazon EC2 ubuntu 机器上运
我想通过用户空间中的mmap-ing并将地址发送到内核空间从用户空间写入VGA内存(视频内存,而不是缓冲区),我将使用pfn remap将这些mmap-ed地址映射到vga内存(我将通过 lspci
在 Mathematica 中,如果你想让一个函数记住它的值,它在语法上是很轻松的。例如,这是标准示例 - 斐波那契: fib[1] = 1 fib[2] = 1 fib[n_]:= fib[n] =
我读到动态内存是在运行时在堆上分配的,而静态内存是在编译时在堆栈上分配的,因为编译器知道在编译时必须分配多少内存。 考虑以下代码: int n; cin>>n; int a[n]; 如果仅在运行期间读
我是 Python 的新手,但我之前还不知道这一点。我在 for 循环中有一个基本程序,它从站点请求数据并将其保存到文本文件但是当我检查我的任务管理器时,我发现内存使用量只增加了?长时间运行时,这对我
我正在设计一组数学函数并在 CPU 和 GPU(使用 CUDA)版本中实现它们。 其中一些函数基于查找表。大多数表占用 4KB,其中一些占用更多。基于查找表的函数接受一个输入,选择查找表的一两个条目,
读入一个文件,内存被动态分配给一个字符串,文件内容将被放置在这里。这是在函数内部完成的,字符串作为 char **str 传递。 使用 gdb 我发现在行 **(str+i) = fgetc(aFil
我需要证实一个理论。我正在学习 JSP/Java。 在查看了一个现有的应用程序(我没有写)之后,我注意到一些我认为导致我们的性能问题的东西。或者至少是其中的一部分。 它是这样工作的: 1)用户打开搜索
n我想使用memoization缓存某些昂贵操作的结果,这样就不会一遍又一遍地计算它们。 两个memoise和 R.cache适合我的需要。但是,我发现缓存在调用之间并不可靠。 这是一个演示我看到的问
我目前正在分析一些 javascript shell 代码。这是该脚本中的一行: function having() { memory = memory; setTimeout("F0
我有一种情况,我想一次查询数据库,然后再将整个数据缓存在内存中。 我得到了内存中 Elasticsearch 的建议,我用谷歌搜索了它是什么,以及如何在自己的 spring boot 应用程序中实现它
我正在研究 Project Euler (http://projecteuler.net/problem=14) 的第 14 题。我正在尝试使用内存功能,以便将给定数字的序列长度保存为部分结果。我正在
所以,我一直在做 Java 内存/注意力游戏作业。我还没有达到我想要的程度,它只完成了一半,但我确实让 GUI 大部分工作了......直到我尝试向我的框架添加单选按钮。我认为问题可能是因为我将 JF
我一直在尝试使用 Flask-Cache 的 memoize 功能来仅返回 statusTS() 的缓存结果,除非在另一个请求中满足特定条件,然后删除缓存。 但它并没有被删除,并且 Jinja 模板仍
我对如何使用 & 运算符来减少内存感到非常困惑。 我可以回答下面的问题吗? clase C{ function B(&$a){ $this->a = &$a; $thi
在编写代码时,我遇到了一个有趣的问题。 我有一个 PersonPOJO,其 name 作为其 String 成员之一及其 getter 和 setter class PersonPOJO { priv
在此代码中 public class Base { int length, breadth, height; Base(int l, int b, int h) { l
Definition Structure padding is the process of aligning data members of the structure in accordance
在 JavaScript Ninja 的 secret 中,作者提出了以下方案,用于在没有闭包的情况下内存函数结果。他们通过利用函数是对象这一事实并在函数上定义一个属性来存储过去调用函数的结果来实现这
我正在尝试找出 map 消耗的 RAM 量。所以,我做了以下事情;- Map cr = crPair.collectAsMap(); // 200+ entries System.out.printl
我是一名优秀的程序员,十分优秀!