- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用内部汇编器在 V8 中实现我自己的 Math.clamp
版本。
我设法使用 Torque 脚本语言生成了它的一个版本,并想尝试使用 CodeStubAssembler 内置函数进行类似的实现。我意识到它们被认为是守旧派,但这似乎是生成我想要的实际程序集的最简单方法。目标是让编译器生成类似 to this as possible 的代码。
问题是:是否有一个已经生成cmp
和cmov
指令的汇编例程?如果没有,我将如何生成它?
这仅用于教育目的,这就是为什么我只对 x64 管道感兴趣并将所有输入都视为整数。
最佳答案
这里是 V8 开发人员。 CodeStubAssembler 的设计目的不是让您精确控制发出哪些汇编指令——它独立于平台,这是它存在的重要原因。
您可以查看 src/builtins/builtins-math-gen.cc
中的 MathBuiltinsAssembler::MathMaxMin
及其在同一个文件中更下方的两个调用站点,以查看您将如何在 CSA 中表达一系列最小/最大操作(或其他条件选择)。然后由支持 CSA 的 Turbofan 后端在每个平台上选择合适的机器指令。如果您认为可以改进机器代码,那么解决这个问题的方法就是改进 Turbofan 的指令选择器(和/或更早的优化过程)以检测相关模式。
如果您真的想手动编写特定于平台的程序集,您也可以这样做:您可以使用特定于平台的 MacroAssembler 而不是 CodeStubAssembler,它(在 x64 上)公开了 cmp
和 cmov
。剩下一些这样的内置函数,您可以作为示例进行研究,请查看 src/builtins/x64/builtins-x64.cc
。过去有更多这些,但我们已经将它们几乎全部迁移到其他实现技术,如 C++、CSA 或 Torque,因为读取/编写/调试/维护汇编代码既耗时又容易出错。
关于assembly - 在 V8 中为 x64 生成 cmp 和 cmov 指令,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57616574/
我在某处看到 GCC 编译器在将我的代码转换为 ASM 时有时可能不喜欢使用条件 mov。 在哪些情况下它可能会选择执行条件 mov 以外的操作? 最佳答案 当分支的两边都很短时,编译器通常倾向于将
我似乎无法得到 cmove以我想要的方式工作。我有这么一段代码: cmove $1, %eax 我在编译时收到此错误: Error: operand type mismatch for `cmov
这个问题已经有答案了: Why is a conditional move not vulnerable to Branch Prediction Failure? (5 个回答) 已关闭 7 年前。
C 代码: int cread(int *xp) { return (xp ? *xp : 0); } 汇编代码:(来自不允许编译器执行的教科书示例)使用条件移动指令 movl $0,
我正在尝试编写一些高性能汇编函数作为练习,并且在运行程序时遇到了一个奇怪的段错误,但在 valgrind 或 nemiver 中没有。 基本上不应该运行的 cmov,带有越界地址,即使条件始终为假,也
对于 64 位寄存器,有 CMOVcc A, B指令,只写 B至 A如果条件cc满意: ; Do rax <- rdx iff rcx == 0 test rcx, rcx cmove rax, rd
我知道当一个分支很容易预测时,最好使用 IF 语句,因为该分支是完全免费的。我了解到,如果分支不容易预测,那么 CMOV 会更好。但是,我不太明白如何实现这一点? 当然,问题域仍然是相同的——我们不知
为了在运行 Windows 7 pro 的英特尔核心 2 上执行一些 cmov 指令,我编写了下面的代码。它所做的只是从控制台获取一个字符串作为输入,应用一些移位操作来生成一个随机种子,然后将该种子传
我有一个由一个生产者写入并由 N 个消费者读取的环形缓冲区。因为它是一个环形缓冲区,所以生产者写入的索引小于消费者当前的最小索引是可以的。生产者和消费者的位置由他们自己的 Cursor 跟踪。 cla
我有这个简单的二进制搜索成员函数,其中 lastIndex 、 nIter 和 xi 是类成员: uint32 scalar(float z) const { uint32 lo = 0;
在 x86 上的 64 位模式下,大多数 32 位算术运算会清除目标寄存器的前 32 位。如果算术运算是“cmov”指令,并且条件为假怎么办? (我看过的引用手册好像都没有这个案例)。 最佳答案 它总
文章中Linear vs. Binary Search ,有一个使用 CMOV 指令的二进制搜索的快速实现。我想在 VC++ 中实现它,因为我正在处理的应用程序依赖于二进制搜索的性能。 该实现有一些
我正在尝试使用内部汇编器在 V8 中实现我自己的 Math.clamp 版本。 我设法使用 Torque 脚本语言生成了它的一个版本,并想尝试使用 CodeStubAssembler 内置函数进行类似
我是一名优秀的程序员,十分优秀!