- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
当在 Rust 中编写将运行数百万次的整数函数时(想想像素处理),使用具有最高性能的操作是很有用的——类似于 C/C++。
虽然引用手册解释了行为的变化,但并不总是很清楚哪些方法比标准的(见注释 1.) 整数算术运算具有更高的性能。我假设 wrapping_add
编译成等同于 C 的加法。
在标准运算(加/减/乘/模/除/移位/位操作...)中,哪些运算具有默认情况下未使用的更高性能替代方案?
注意:
a + b
、i/k
或 c % e
的整数运算...等最佳答案
Of the standard operations (add / subtract / multiply / modulo / divide / shift / bit manipulation...), which operations have higher performance alternatives which aren't used by default?
请注意,Rust 是为性能而设计的;因此,虽然在 Debug 中检查了整数运算,但在 Release 中它们被定义为包装,除非您特别指示编译器否则。 p>
因此,在具有默认选项的 Release模式下,严格之间没有性能差异:
+
和 wrapping_add
-
和 wrapping_sub
*
和 wrapping_mul
/
和 wrapping_div
%
和 wrapping_rem
<<
和 wrapping_shl
>>
和 wrapping_shr
对于无符号整数,性能因此严格类似于 C 或 C++;然而,对于有符号整数,优化器可能会产生不同的结果,因为有符号整数的下溢/溢出在 C 和 C++ 中是未定义的行为(gcc 和 Clang 接受一个 -fwrapv
标志来强制包装即使是有符号整数,但这不是默认值) .
我希望使用 checked_*
, overflow_*
和 saturating_*
然而,方法通常会更慢。
然后,一个有趣的切线是了解当您按下开关并明确要求检查算法时会发生什么。
目前,Rust 实现1 是下溢/溢出检查的精确实现。每个加法、减法、乘法……都是独立检查的,优化器不擅长融合这些分支。
具体而言,精确 实现可排除临时溢出:5 + x - 5
无法优化为 x
,因为 5 + x
可能会溢出。它还排除了一般的自动矢量化。
只有当优化器可以证明不存在溢出时(它通常不能),您可能希望重新获得更适合优化的无分支路径。
人们应该注意到,对于一般软件来说,这种影响几乎不明显,因为算术指令只占总成本的一小部分。然而,当这个比例上升时,它会非常明显,而且它确实出现在 SPEC2006 基准测试中的一部分与 Clang 中。
此开销足以被视为不适合默认激活的检查。
1 这是由于 LLVM 方面的技术限制; Rust 实现只是委托(delegate)给 LLVM。
在未来,有希望实现检查的模糊。模糊实现背后的想法是,不是检查每个操作,而是只执行它们并设置一个标志,或者在下溢/溢出的情况下使值中毒。然后,在使用结果之前,执行检查(分支)。
根据 Joe Duffy 的说法,他们在 Midori 中有这样的实现,并且性能影响几乎不明显,因此它似乎是可行的。不过,我还不知道在 LLVM 中有任何类似的努力。
关于rust - Rust 中哪些整数运算具有更高性能的替代方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41101936/
编辑备注 由于 Rust(版本:1.42)仍然没有稳定的 ABI ,推荐使用extern (目前相当于extern "C"(将来可能会改变))否则,可能需要重新编译库。 This article解释如
词法分析器/解析器文件位于 here非常大,我不确定它是否适合只检索 Rust 函数列表。也许我自己编写/使用另一个库是更好的选择? 最终目标是创建一种执行管理器。为了上下文化,它将能够读取包装在函数
我试图在 Rust 中展平 Enum 的向量,但我遇到了一些问题: enum Foo { A(i32), B(i32, i32), } fn main() { let vf =
我正在 64 位模式下运行的 Raspberry Pi 3 上使用 Rust 进行裸机编程。我已经实现了一个自旋锁,如下所示: use core::{sync::atomic::{AtomicBool
我无法理解以下示例是如何从 this code 中提炼出来的, 编译: trait A: B {} trait B {} impl B for T where T: A {} struct Foo;
在我写了一些代码和阅读了一些文章之后,我对 Rust 中的移动语义有点困惑,我认为值移动后,它应该被释放,内存应该是无效的。所以我尝试写一些代码来作证。 第一个例子 #[derive(Debug)]
https://doc.rust-lang.org/reference/types/closure.html#capture-modes struct SetVec { set: HashSe
考虑 const-generic 数据结构的经典示例:方矩阵。 struct Matrix { inner: [[T; N]; N] } 我想返回一个结构体,其 const 参数是动态定义的:
以下代码无法编译,因为 x在移动之后使用(因为 x 具有类型 &mut u8 ,它没有实现 Copy 特性) fn main() { let mut a: u8 = 1; let x:
我在玩 Rust,发现了下面的例子: fn main() { let mut x = [3, 4, 5].to_vec(); x; println!("{:?}", x); }
假设一个 Rust 2018 宏定义了一个 async里面的功能。它将使用的语法与 Rust 2015 不兼容。因此,如果您使用 2015 版编译您的 crate,那么宏中的扩展代码不会与它冲突吗?
假设我有一些 Foo 的自定义集合s: struct Bar {} struct Foo { bar: Bar } struct SubList { contents: Vec, }
代码如下: fn inner(x:&'a i32, _y:&'b i32) -> &'b i32 { x } fn main() { let a = 1; { let b
在lifetime_things的定义中,'b的生命周期比'a长,但实际上当我调用这个函数时,x1比y1长,但是这样可以编译成功: //here you could see 'b:'a means
我正在尝试检索 FLTK-RS Widget 周围的 Arc Mutex 包装器的内部值: pub struct ArcWidget(Arc>); impl ArcWidget{ pub
如下代码所示,我想封装一个定时函数,返回一个闭包的结果和执行时间。 use tap::prelude::Pipe; use std::time::{Instant, Duration}; pub fn
我想实现自己的通用容器,这是我正在使用的特征的片段: pub trait MyVec where Self: Default + Clone + IntoIterator, Self:
所需代码: 注释掉的块可以编译并工作,但是我想从嵌套的匹配样式转变为更简洁的函数链 async fn ws_req_resp(msg: String, conn: PgConn) -> Result>
我正在尝试编写一些代码,该代码将生成具有随机值的随机结构。对于结构,我具有以下特征和帮助程序宏: use rand::{thread_rng, Rng}; use std::fmt; pub trai
我有一个带有函数成员的结构: struct Foo { fun: Box, } type FooI = Foo; 这不起作用: error[E0106]: missing lifetime s
我是一名优秀的程序员,十分优秀!