gcc - 在 GCC 内联汇编中检索 ZF-6ren

gcc - 在 GCC 内联汇编中检索 ZF

转载作者：行者123 更新时间：2023-12-02 20:56:05

28

4

我需要使用一些没有 GCC 内在函数的 x86 指令，例如 BSF 和 BSR。使用 GCC 内联汇编，我可以编写如下内容

__INTRIN_INLINE unsigned char bsf64(unsigned long* const index, const uint64_t mask)
{
__asm__("bsf %[mask], %[index]" : [index] "=r" (*index) : [mask] "mr" (mask));
return mask ? 1 : 0;
}

类似 if (bsf64(x, y)) {/* use x */} 的代码被 GCC 翻译为类似的内容

0x000000010001bf04 <bsf64+0>:   bsf    %rax,%rdx
0x000000010001bf08 <bsf64+4>:   test   %rax,%rax
0x000000010001bf0b <bsf64+7>:   jne    0x10001bf44 <...>

但是，如果mask为零，则BSF已经设置了ZF标志，因此bsf之后的test是多余的。

而不是返回 mask ？ 1 : 0，是否可以检索ZF标志并返回它，使GCC不生成测试？

编辑:使 if 示例更加清晰

编辑:响应 Damon，__builtin_ffsl 生成的代码甚至不太理想。如果我使用以下代码

    int b = __builtin_ffsl(mask);
    if (b) {
        *index = b - 1;
        return true;
    } else {
        return false;
    }

GCC 生成此程序集

   0x000000000044736d <+1101>:  bsf    %r14,%r14
   0x0000000000447371 <+1105>:  cmove  %r12,%r14
   0x0000000000447375 <+1109>:  add    $0x1,%r14d
   0x0000000000447379 <+1113>:  je     0x4471c0 <...>
   0x000000000044737f <+1119>:  lea    -0x1(%r14),%ecx

因此，测试消失了，但生成了冗余的条件移动、增量和减量。

最佳答案

几点说明:

这是一种“反优化”。您正在尝试对编译器已支持的内容进行微优化。
使用我的 gcc 版本并打开所有优化开关，您的代码根本不会生成 bsf 指令。查看代码，这并不奇怪，因为您返回 mask，它是源操作数，而不是目标操作数(gcc 使用 AT&T 语法!)。编译器足够智能，可以解决这个问题，并完全删除汇编代码(它不执行任何操作)。
有一个内部函数__builtin_ffsl，它的作用与内联程序集完全相同(尽管是正确的)。内在函数的可移植性并不比内联汇编程序差，但编译器更容易优化。
使用内部函数会在我的编译器上产生 bsf cmov 序列(假设调用代码强制它实际发出指令)，这表明编译器可以很好地使用零标志，而无需额外的测试说明。
当你想要一个 bool 时返回一个 char 对于编译器来说并不是最好的提示，尽管它在大多数情况下可能会弄清楚。然而，当您实际上只对“零或非零”感兴趣时，告诉编译器使用位扫描指令肯定不是最佳选择。 if(x) 和 if(!x) 在这方面工作得非常好。如果您返回结果作为引用，情况会有所不同，因此您可以在其他地方重用它，但事实上，您的代码只是一种非常复杂的 if(x) 编写方式。<

关于gcc - 在 GCC 内联汇编中检索 ZF，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6895714/

28

4

0

文章推荐： objective-c - 我的应用程序在 CGRectIntersectsRect 上崩溃

文章推荐： python-3.x - valueerror 尝试将值(类型模型)转换为张量

文章推荐： assembly - 使用 GDT 保护模式下的汇编器跳转

文章推荐： shiny - 多次重新渲染相同的 UI

汇编 - 在图形模式下打印一个字符
我试图在图形模式下打印一个字符。通常当我打印我正在做的一个字符时: mov ah,14 ; ah=14 mov al,'x' int 10h ; print the character 这
汇编 - 试图将字节移动到内存不起作用
我试图通过更改其中的一个字节来修改存储在内存中的字符串。我为此使用了 movb，但由于某种原因，给定内存位置的字节没有改变。在 gdb 调试器上: 14 movb %al, (%r10) # nex
汇编-x86调用指令和内存地址？
我一直在阅读一些汇编代码，并且开始发现调用指令实际上是与程序计数器相关的。但是，每当我使用 Visual Studio 或 Windbg 进行调试时，它总是显示 call 0xFFFFFF ...这
汇编、栈上局部变量的算术运算
我最近一直在使用 Visual C++ 中的内联汇编，我想知道是否可以直接向堆栈上的局部变量添加值，例如: push 5 add [esp], 7 这样做可以吗？我问这个问题是因为我在执行此操作时随机
汇编-进位标志VS溢出标志
我有下一个代码: mov al, -5 add al, 132 add al, 1 据我检查，溢出标志和进位标志将在第一个操作中设置，而在第二个操作中，仅设置溢出。但我不明白为什么: 在无符号数中，
汇编，将单个字节从寄存器写入内存会覆盖其他字节
在 64 位 x86 汇编 nasm 中，如何将单个字节从寄存器移动到 .data 节中定义的内存位置？我知道这有效 global _main section .data quotient db 0
汇编、打印ascii码
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字，但是当我尝试打印它时，它打印的是 ascii 字符而不是 ascii 数字，所以我决定编写一个程序将 ascii char 转换为 ascii
汇编——机器码中的跳转指令
为什么第 1B 行的跳转指令(例如)变成了 EBBD？我知道“jmp”= EB但是BD是怎么计算的呢？最佳答案短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。例如，第一个 JMP
汇编:add指令和操作符add的区别
以下两者有什么区别: mov eax, [eax+4] 和 add eax, 4 mov eax, [eax] 如果不是，那么汇编器是否会选择哪个来进行某种优化？最佳答案这
汇编/反汇编指令操作数
看《The Shellcoder's Handbook》中的一些汇编和反汇编代码，发现一条指令的序列操作数是不一样的。例如，在 assembly 上: mov ebx,0 并且，在反汇编时: mov
汇编，检测溢出寄存器
我有这个非常简单的汇编代码: start: add ax, 100 ; if ax overflow add to bx 1 jmp start 但我不知道如何检测 ax 寄存器溢出，有人可以帮
汇编，将单个字节从寄存器写入内存会覆盖其他字节
在 64 位 x86 汇编 nasm 中，如何将单个字节从寄存器移动到 .data 节中定义的内存位置？我知道这有效 global _main section .data quotient db 0
汇编、打印ascii码
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字，但是当我尝试打印它时，它打印的是 ascii 字符而不是 ascii 数字，所以我决定编写一个程序将 ascii char 转换为 ascii
汇编 << 运算符
我正在学习一些关于操作系统开发的教程，我发现了一篇关于多重引导 header 。这些是您必须定义的一些“神奇”值才能使用GRUB2。这些是命令: # Declare constants used f
汇编——机器码中的跳转指令
为什么第 1B 行的跳转指令(例如)变成了 EBBD？我知道“jmp”= EB但是BD是怎么计算的呢？最佳答案短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。例如，第一个 JMP
从内存地址复制字辅助(汇编)
我正在尝试从内存中复制一些单词并使用汇编将其保存到另一个内存地址。我正在尝试为其编写代码，但我不确定其中的某些部分。我将简要描述我想要做什么。源地址、目标地址和要复制的字数是函数的输入参数。最佳答
汇编 MOV 指令操作数
当我们想要像这样创建一个初始化变量时: name db 'zara ali' 我们创建了一个字节大小变量，但我们在其中存储了一个字符串这怎么可能？？当我们使用这条指令时: MOV ecx, nam
汇编:16 位除法
我还是汇编的新手，我还不知道汇编中的许多命令代码。我想在 16 位寄存器中进行除法。我想打印它的内容。我知道我需要将寄存器的内容转换为 ASCII 进行打印，但同样，我的问题是除法。请帮我。比如cx
assembly - 汇编/机器代码中相等的分支
使用有什么区别: c.eq.s $1, $2 bc1t L2 并使用: beq $1, $2, L2 如果他们做同样的事情，为什么有两种分支方式？如果它们不同，那么它们各自的好处是什么
c - 汇编:在调用函数之前加载有效地址的目的？
源代码: int main() { int i; for(i=0, i : push rbp 2. 0x000055555555463b :

首页

博学

6Ren·AI

商城

gcc - 在 GCC 内联汇编中检索 ZF