- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试从Rust散列图中获取密钥。我有以下基准:
#[bench]
fn rust_get(b: &mut Bencher) {
let (hash, keys) =
get_random_hash::<HashMap<String, usize>>(&HashMap::with_capacity, &rust_insert_fn);
let mut keys = test::black_box(keys);
b.iter(|| {
for k in keys.drain(..) {
hash.get(&k);
}
});
}
get_random_hash
定义为:
fn get_random_hash<T>(
new: &Fn(usize) -> T,
insert: &Fn(&mut T, String, usize) -> (),
) -> (T, Vec<String>) {
let mut keys = Vec::with_capacity(HASH_SIZE);
let mut hash = new(HASH_CAPACITY);
for i in 0..HASH_SIZE {
let k: String = format!("{}", Uuid::new_v4());
keys.push(k.clone());
insert(&mut hash, k, i);
}
return (hash, keys);
}
rust_insert_fn
是:
fn rust_insert_fn(map: &mut HashMap<String, usize>, key: String, value: usize) {
map.insert(key, value);
}
test benchmarks::benchmarks::rust_get ... bench: 1 ns/iter (+/- 0)
test::black_box would solve the problem but it doesn't look like it does. I have even tried wrapping the
hash.get(&k
) in the for loop with
test::black_box',但这仍然优化了代码。如何正确运行代码而不进行优化?
#[bench]
fn rust_get(b: &mut Bencher) {
let (hash, keys) = get_random_hash::<HashMap<String, usize>>(&HashMap::with_capacity, &rust_insert_fn);
let mut keys = test::black_box(keys);
b.iter(|| {
let mut n = 0;
for k in keys.drain(..) {
hash.get(&k);
n += 1;
};
return n;
});
}
#[bench]
fn rust_get_random(b: &mut Bencher) {
let (hash, _) = get_random_hash::<HashMap<String, usize>>(&HashMap::with_capacity, &rust_insert_fn);
b.iter(|| {
for _ in 0..HASH_SIZE {
hash.get(&format!("{}", Uuid::new_v4()));
}
});
}
#[bench]
fn rust_insert(b: &mut Bencher) {
b.iter(|| {
let mut hash = HashMap::with_capacity(HASH_CAPACITY);
for i in 0..HASH_SIZE {
let k: String = format!("{}", Uuid::new_v4());
hash.insert(k, i);
}
});
}
#[bench]
fn rust_del(b: &mut Bencher) {
let (mut hash, keys) = get_random_hash::<HashMap<String, usize>>(&HashMap::with_capacity, &rust_insert_fn);
let mut keys = test::black_box(keys);
b.iter(|| {
for k in keys.drain(..) {
hash.remove(&k);
};
});
}
最佳答案
编译器优化器是如何工作的?
优化器只不过是analyses and transformations的管道。每个单独的分析或转换都相对简单,应用它们的最佳顺序未知,通常由启发式方法确定。
这对我的基准有什么影响?
基准测试很复杂,一般来说,您希望测量优化的代码,但同时一些分析或转换可能会删除您感兴趣的代码,使基准测试变得无用。
因此,熟悉您正在使用的特定优化器的分析和转换过程非常重要,以便能够理解:
哪些是不受欢迎的,
如何挫败他们。
如前所述,大多数通行证相对简单,因此挫败它们也相对简单。困难在于有一百个或更多的人,而你必须知道哪一个是在踢,才能挫败它。
我遇到了哪些优化?
有一些特定的优化经常使用基准:
Constant Propagation:允许在编译时计算部分代码,
Loop Invariant Code Motion:允许提升循环外某段代码的计算,
Dead Code Elimination:删除无用的代码。
什么?优化器怎么敢这样破坏我的代码?
优化器在所谓的“仿佛”规则下运行。这个基本规则允许优化器执行任何不改变程序输出的转换。也就是说,它一般不应该改变程序的可观察行为。
除此之外,通常还明确允许进行一些更改。最明显的是,运行时预计会缩减,这反过来意味着线程交错可能会有所不同,有些语言甚至会有更大的回旋余地。
我用过!
什么是black_box
?它是一个函数,其定义对优化器来说是特别不透明的。这对编译器允许执行的优化有一些影响,因为它可能有副作用。因此,这意味着:
转换后的代码必须执行与原始代码相同数量的对black_box
的调用,
转换后的代码必须按照与传入参数相同的顺序执行上述调用,
不能对black_box
返回的值进行假设。
因此,手术使用black_box
可以挫败某些优化。然而,盲目的使用可能不会挫败正确的使用。
我遇到了哪些优化?
让我们从原始代码开始:
#[bench]
fn rust_get(b: &mut Bencher) {
let (hash, mut keys): (HashMap<String, usize>, _) =
get_random_hash(&HashMap::with_capacity, &rust_insert_fn);
b.iter(|| {
for k in keys.drain(..) {
hash.get(&k);
}
});
}
black_box
中的循环将迭代所有键,并为每个键执行
b.iter()
:
hash.get()
的结果未使用,
hash.get()
是一个纯功能,意味着它没有副作用。
b.iter(|| { for k in keys.drain(..) {} })
hash.get()
可以优化为
for k in keys.drain(..) {}
。
drop(keys)
的外科应用可以挫伤DCE:
b.iter(|| {
for k in keys.drain(..) {
black_box(hash.get(&k));
}
});
black_box
的影响:
black_box
,
black_box
的每个调用都必须使用预期的参数执行。
black_box
并用所述值替换它。
hash.get(&k)
来实现,正如您在上面所做的,或者映射。如果要对空映射进行基准测试,则必须使用后者,在这里它们是相等的。
#[bench]
fn rust_get(b: &mut Bencher) {
let (hash, keys): (HashMap<String, usize>, _) =
get_random_hash(&HashMap::with_capacity, &rust_insert_fn);
let mut keys = test::black_box(keys);
b.iter(|| {
for k in keys.drain(..) {
test::black_box(hash.get(&k));
}
});
}
let mut keys = black_box(keys);
,
keys.drain()
。
hash.get()
的性能,所以我只能假设对
get
的调用是一个错误。
#[bench]
fn rust_get(b: &mut Bencher) {
let (hash, keys): (HashMap<String, usize>, _) =
get_random_hash(&HashMap::with_capacity, &rust_insert_fn);
let keys = test::black_box(keys);
b.iter(|| {
for k in &keys {
test::black_box(hash.get(k));
}
});
}
keys.drain(..)
的闭包需要运行多次:如果第一次耗尽密钥,那么之后还剩下什么?空的。。。
b.iter()
运行闭包直到其时间稳定,它可能只是在第一次运行时排出
Vec
,然后计时一个空循环。
关于hashmap - Rust基准测试优化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48842252/
编辑备注 由于 Rust(版本:1.42)仍然没有稳定的 ABI ,推荐使用extern (目前相当于extern "C"(将来可能会改变))否则,可能需要重新编译库。 This article解释如
词法分析器/解析器文件位于 here非常大,我不确定它是否适合只检索 Rust 函数列表。也许我自己编写/使用另一个库是更好的选择? 最终目标是创建一种执行管理器。为了上下文化,它将能够读取包装在函数
我试图在 Rust 中展平 Enum 的向量,但我遇到了一些问题: enum Foo { A(i32), B(i32, i32), } fn main() { let vf =
我正在 64 位模式下运行的 Raspberry Pi 3 上使用 Rust 进行裸机编程。我已经实现了一个自旋锁,如下所示: use core::{sync::atomic::{AtomicBool
我无法理解以下示例是如何从 this code 中提炼出来的, 编译: trait A: B {} trait B {} impl B for T where T: A {} struct Foo;
在我写了一些代码和阅读了一些文章之后,我对 Rust 中的移动语义有点困惑,我认为值移动后,它应该被释放,内存应该是无效的。所以我尝试写一些代码来作证。 第一个例子 #[derive(Debug)]
https://doc.rust-lang.org/reference/types/closure.html#capture-modes struct SetVec { set: HashSe
考虑 const-generic 数据结构的经典示例:方矩阵。 struct Matrix { inner: [[T; N]; N] } 我想返回一个结构体,其 const 参数是动态定义的:
以下代码无法编译,因为 x在移动之后使用(因为 x 具有类型 &mut u8 ,它没有实现 Copy 特性) fn main() { let mut a: u8 = 1; let x:
我在玩 Rust,发现了下面的例子: fn main() { let mut x = [3, 4, 5].to_vec(); x; println!("{:?}", x); }
假设一个 Rust 2018 宏定义了一个 async里面的功能。它将使用的语法与 Rust 2015 不兼容。因此,如果您使用 2015 版编译您的 crate,那么宏中的扩展代码不会与它冲突吗?
假设我有一些 Foo 的自定义集合s: struct Bar {} struct Foo { bar: Bar } struct SubList { contents: Vec, }
代码如下: fn inner(x:&'a i32, _y:&'b i32) -> &'b i32 { x } fn main() { let a = 1; { let b
在lifetime_things的定义中,'b的生命周期比'a长,但实际上当我调用这个函数时,x1比y1长,但是这样可以编译成功: //here you could see 'b:'a means
我正在尝试检索 FLTK-RS Widget 周围的 Arc Mutex 包装器的内部值: pub struct ArcWidget(Arc>); impl ArcWidget{ pub
如下代码所示,我想封装一个定时函数,返回一个闭包的结果和执行时间。 use tap::prelude::Pipe; use std::time::{Instant, Duration}; pub fn
我想实现自己的通用容器,这是我正在使用的特征的片段: pub trait MyVec where Self: Default + Clone + IntoIterator, Self:
所需代码: 注释掉的块可以编译并工作,但是我想从嵌套的匹配样式转变为更简洁的函数链 async fn ws_req_resp(msg: String, conn: PgConn) -> Result>
我正在尝试编写一些代码,该代码将生成具有随机值的随机结构。对于结构,我具有以下特征和帮助程序宏: use rand::{thread_rng, Rng}; use std::fmt; pub trai
我有一个带有函数成员的结构: struct Foo { fun: Box, } type FooI = Foo; 这不起作用: error[E0106]: missing lifetime s
我是一名优秀的程序员,十分优秀!