c - 如何从内联汇编访问 C 结构/变量？-6ren

c - 如何从内联汇编访问 C 结构/变量？

转载作者：行者123 更新时间：2023-12-04 06:41:12

考虑以下代码:

    int bn_div(bn_t *bn1, bn_t *bn2, bn_t *bnr)
  {
    uint32 q, m;        /* Division Result */
    uint32 i;           /* Loop Counter */
    uint32 j;           /* Loop Counter */

    /* Check Input */
    if (bn1 == NULL) return(EFAULT);
    if (bn1->dat == NULL) return(EFAULT);
    if (bn2 == NULL) return(EFAULT);
    if (bn2->dat == NULL) return(EFAULT);
    if (bnr == NULL) return(EFAULT);
    if (bnr->dat == NULL) return(EFAULT);


    #if defined(__i386__) || defined(__amd64__)
    __asm__ (".intel_syntax noprefix");
    __asm__ ("pushl %eax");
    __asm__ ("pushl %edx");
    __asm__ ("pushf");
    __asm__ ("movl %eax, (bn1->dat[i])");
    __asm__ ("xorl %edx, %edx");
    __asm__ ("divl (bn2->dat[j])");
    __asm__ ("movl (q), %eax");
    __asm__ ("movl (m), %edx");
    __asm__ ("popf");
    __asm__ ("popl %edx");
    __asm__ ("popl %eax");
    #else
    q = bn->dat[i] / bn->dat[j];
    m = bn->dat[i] % bn->dat[j];
    #endif
    /* Return */
    return(0);
  }

数据类型 uint32 基本上是 unsigned long int 或 uint32_t 无符号 32 位整数。 bnint 类型是无符号短整型 (uint16_t) 或 uint32_t，具体取决于 64 位数据类型是否可用。如果 64 位可用，则 bnint 为 uint32，否则为 uint16。这样做是为了捕获代码其他部分的进位/溢出。结构体bn_t定义如下:

typedef struct bn_data_t bn_t;
struct bn_data_t
  {
    uint32 sz1;         /* Bit Size */
    uint32 sz8;         /* Byte Size */
    uint32 szw;         /* Word Count */
    bnint *dat;         /* Data Array */
    uint32 flags;       /* Operational Flags */
  };

该函数在我的源代码中从第 300 行开始。因此，当我尝试编译/制作它时，出现以下错误:

system:/home/user/c/m3/bn 1036 $$$ ->make
clang -I. -I/home/user/c/m3/bn/.. -I/home/user/c/m3/bn/../include  -std=c99 -pedantic -Wall -Wextra -Wshadow -Wpointer-arith -Wcast-align -Wstrict-prototypes  -Wmissing-prototypes -Wnested-externs -Wwrite-strings -Wfloat-equal  -Winline -Wunknown-pragmas -Wundef -Wendif-labels  -c /home/user/c/m3/bn/bn.c
/home/user/c/m3/bn/bn.c:302:12: warning: unused variable 'q' [-Wunused-variable]
    uint32 q, m;        /* Division Result */
           ^
/home/user/c/m3/bn/bn.c:302:15: warning: unused variable 'm' [-Wunused-variable]
    uint32 q, m;        /* Division Result */
              ^
/home/user/c/m3/bn/bn.c:303:12: warning: unused variable 'i' [-Wunused-variable]
    uint32 i;           /* Loop Counter */
           ^
/home/user/c/m3/bn/bn.c:304:12: warning: unused variable 'j' [-Wunused-variable]
    uint32 j;           /* Loop Counter */
           ^
/home/user/c/m3/bn/bn.c:320:14: error: unknown token in expression
    __asm__ ("movl %eax, (bn1->dat[i])");
             ^
<inline asm>:1:18: note: instantiated into assembly here
        movl %eax, (bn1->dat[i])
                        ^
/home/user/c/m3/bn/bn.c:322:14: error: unknown token in expression
    __asm__ ("divl (bn2->dat[j])");
             ^
<inline asm>:1:12: note: instantiated into assembly here
        divl (bn2->dat[j])
                  ^
4 warnings and 2 errors generated.
*** [bn.o] Error code 1

Stop in /home/user/c/m3/bn.
system:/home/user/c/m3/bn 1037 $$$ ->

我所知道的:

我认为自己相当精通 x86 汇编程序(从我上面编写的代码可以看出)。然而，我最后一次混合使用高级语言和汇编程序是在大约 15-20 年前使用 Borland Pascal 编写游戏图形驱动程序时(Windows 95 之前的时代)。我熟悉的是英特尔语法。

我不知道的:

如何从 asm 访问 bn_t 的成员(尤其是 *dat)？因为 *dat 是指向 uint32 的指针，所以我将元素作为数组访问(例如 bn1->dat[i])。

如何访问在堆栈上声明的局部变量？

我正在使用 push/pop 将被破坏的寄存器恢复到它们以前的值，以免扰乱编译器。但是，我还需要在局部变量中包含 volatile 关键字吗？

或者，有没有我不知道的更好的方法？我不想将它放在一个单独的函数调用中，因为调用开销是因为这个函数对性能至关重要。

附加:

现在，我才刚刚开始编写这个函数，所以还没有完成。缺少循环和其他此类支持/粘合代码。但是，主要要点是访问局部变量/结构元素。

编辑 1:

我使用的语法似乎是 clang 唯一支持的语法。我尝试了以下代码，但 clang 给了我各种各样的错误:

__asm__ ("pushl %%eax",
    "pushl %%edx",
    "pushf",
    "movl (bn1->dat[i]), %%eax",
    "xorl %%edx, %%edx",
    "divl ($0x0c + bn2 + j)",
    "movl %%eax, (q)",
    "movl %%edx, (m)",
    "popf",
    "popl %%edx",
    "popl %%eax"
    );

它要我在第一行放一个右括号，代替逗号。我改用 %% 而不是 %，因为我在某处读到内联汇编需要 %% 来表示 CPU 寄存器，而 clang 告诉我我使用了无效的转义序列。

最佳答案

如果你只需要 32b/32b => 32 位除法，让编译器使用 div 的两个输出，gcc、clang 和 icc 都可以，因为你可以在 Godbolt compiler explorer 上看到:

uint32_t q = bn1->dat[i] / bn2->dat[j];
uint32_t m = bn1->dat[i] % bn2->dat[j];

编译器非常擅长 CSE将其合并到一个 div 中。只要确保您没有将除法结果存储在 gcc 无法证明不会影响余数输入的地方。

例如*m = dat[i]/dat[j] 可能重叠(别名)dat[i] 或 dat[j]，所以 gcc将不得不重新加载操作数并为 % 操作重做 div。请参阅 godbolt 链接以了解坏/好示例。

对 32bit/32bit = 32bit div 使用内联 asm 不会给你带来任何好处，而且实际上会用 clang 生成更糟糕的代码(参见 godbolt 链接)。

如果您需要 64 位/32 位 = 32 位，您可能需要 asm，但是，如果没有内置的编译器。 (GNU C 没有，AFAICT)。 C 中显而易见的方法(将操作数转换为 uint64_t)生成对 64bit/64bit = 64bit libgcc 函数的调用，该函数具有分支和多个 div 指令。 gcc 不擅长证明结果适合 32 位，因此单个 div 指令不会导致 #DE。

对于许多其他指令，您可以很多避免使用builtin functions for things like popcount 编写内联汇编.使用 -mpopcnt，它编译为 popcnt 指令(并解释了 Intel CPU 对输出操作数的错误依赖。)没有，它编译为 libgcc 函数打电话。

总是喜欢编译成好的 asm 的内置函数或纯 C，这样编译器就知道代码做了什么。当内联使某些参数在编译时已知时，纯 C 可以是 optimized away or simplified ，但是使用内联 asm 的代码只会将常量加载到寄存器中并在运行时执行 div。内联 asm 在对相同数据进行类似计算时也击败了 CSE，当然也不能自动向量化。

正确使用 GNU C 语法

https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html解释了如何告诉汇编程序您需要寄存器中的哪些变量，以及输出是什么。

You can use Intel/MASM-like syntax and mnemonics, and non-% register names if you like ，最好使用 -masm=intel 进行编译。 AT&T 语法错误 ( fsub and fsubr mnemonics are reversed ) 可能仍然存在于英特尔语法模式中；我忘记了。

大多数使用 GNU C 内联汇编的软件项目仅使用 AT&T 语法。

另见 the bottom of this answer有关更多 GNU C 内联汇编信息，以及 x86标记维基。

asm 语句采用一个字符串参数和 3 组约束。使其成为多行的最简单方法是使每个 asm 行成为一个以 \n 结尾的单独字符串，并让编译器隐式连接它们。

此外，您还可以告诉编译器您想要将内容存入哪个寄存器。这样，如果变量已经在寄存器中，编译器就不必溢出它们并让您加载和存储它们。这样做真的会搬起石头砸自己的脚。 tutorial评论中链接的 Brett Hale 希望涵盖所有这一切。

使用 GNU C 内联汇编的 `div` 的正确示例

您可以在 godbolt 上看到编译器 asm 输出.

uint32_t q, m;  // this is unsigned int on every compiler that supports x86 inline asm with this syntax, but not when writing portable code.

asm ("divl %[bn2dat_j]\n"
      : "=a" (q), "=d" (m) // results are in eax, edx registers
      : "d" (0),           // zero edx for us, please
        "a" (bn1->dat[i]), // "a" means EAX / RAX
        [bn2dat_j] "mr" (bn2->dat[j]) // register or memory, compiler chooses which is more efficient
      : // no register clobbers, and we don't read/write "memory" other than operands
    );

"divl %4" 也可以工作，但是当您添加更多输入/输出约束时，命名的输入/输出不会更改名称。

关于c - 如何从内联汇编访问 C 结构/变量？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32741032/

文章推荐： twitter - 获取 Twitter 主页时间线推文

文章推荐： django-admin startproject 试图创建 manage.py 两次？

html - 内联/内联 block 不起作用。 Div 仍然堆积
我之前已经发布了一些这样的代码，试图在正确的位置获得侧边栏链接并以一种特殊的方式看起来，我决定朝着不同的方向前进。我现在需要的是知道我应该做什么来获得我在侧边栏旁边而不是下方标记为“内容”的 div。
html - 内联/内联 block 元素的 CSS 垂直对齐
我试图让多个 inline 和 inline-block 组件在 div 中垂直对齐。这个例子中的span怎么就非要往下推呢？我已经尝试了 vertical-align:middle; 和 verti
html - 内联/内联 block 元素的 CSS 垂直对齐
我试图让多个 inline 和 inline-block 组件在 div 中垂直对齐。这个例子中的span怎么就非要往下推呢？我已经尝试了 vertical-align:middle; 和 verti
html - 内联/内联 block 元素的 CSS 垂直对齐
我试图让多个 inline 和 inline-block 组件在 div 中垂直对齐。这个例子中的span怎么就非要往下推呢？我已经尝试了 vertical-align:middle; 和 verti
html - CSS - 带边框的 UL 内联 LI 改变 block (v) 内联？
我很困惑...所以我在容器中有一个 UL，当我更改 UL 上方的 DIV 时，它似乎会影响 UL 之后的流程...发生了什么事？ DIV 是 block 元素，对吗？和 UL 一样，对吧？所以在这个
Are the "inline" keyword and "inlining" optimization separate concepts?(“内联”关键字和“内联”优化是不同的概念吗？)
我问这个基本问题是为了澄清事实。都提到了这个问题及其目前接受的答案，这是不令人信服的。然而，投票第二多的答案提供了更好的洞察力，但也不是完美的。。在阅读下面的内容时，请尝试区分内联关键字和“内联”概念
悬停时javascript更改图像(内联)
function roll_over(img_name, img_src) { document[img_name].src = img_src; } 我使用此代码来显示 T 恤并在鼠标悬停时显
angularjs - 内联 if 中的多个语句
是否可以在 AngularJS 表达式的内联 if 语句中包含多个语句？例如，以下失败: ng-change="someCondition() ? doA(); doB() : doC()" ng-c
R 内联 Markdown
我在 RStudio 中使用 R Markdown 创建一个混合 Markdown 和 R 输出的报告。我知道如何在 Markdown 中使用内联 R 表达式，但我想知道如何进行相反的操作，即在 R
CKEditor 内联 - 无法添加表单标签
我们无法将表单标签添加到内联 CKEditor来自 chrome 和 IE，但它在 Firefox 中运行良好。如果我们将表单添加到内联 CKEditor，它会删除表单标签。例如:如果我在 Fire
Javascript 广播显示无/内联
在我的 HTML 代码中，我有两个输入: Yes No 现在我有一个默认情况下的 div，因为它的样式显示内联，我希望当我单击“否”时，它会使其样式不显示，而"is"则会使其内联，所以我制作了此功
PowerShell 内联 If (IIf)
如何在 PowerShell 中创建带有内联 If 的语句(IIf，另请参阅: Immediate if 或 ternary If )？如果您也认为这应该是 native PowerShell 函数
Django 内联-允许添加禁用编辑
嗨。我在阅读以下问题后提出这个问题:Question_1和 Question_2 。 Question_1 没有任何合适的答案，Question_2 有替代解决方案，但不是完美的解决方案。这里我有两
Python 内联 if 语句
有人可以帮我解决以下语法或告诉我是否可行吗？因为我要修改 if ... else ... 条件。我不想在列表中添加重复的值，但我收到了 KeyError。其实我不太熟悉这种说法: twins[val
python - 内联 if 语句的允许语法
有时我喜欢滥用 python 语法，特别是短的 if block : if True : print 'Hello' else : print 'Bye' 现在我尝试对函数定义做同样的事情: i
内联 block 中的绝对定位元素
我在尝试将 Logo 容器底部对齐到零高度父级时遇到了问题。最好，我想用纯 CSS 来实现这一点。在附带的 fiddle 中，我想让 control-group 的底部与零高度 panel 元素的顶
Javascript 内联 HTML
我需要内联编写 HTML 和 Javascript 代码，即在 HTML 正文中(需要显示一些随机整数值)我搜索了很多博客，但到目前为止没有找到任何帮助。请指教。我想实现这个功能: Offer
虚拟继承函数的 C++ 内联
好吧，这更多的是要求澄清 C++ 的一个特性是如何工作的，而不是一个是否可以的答案。我将从解释我遇到的问题开始，因为直接的答案是它不是一个很好的类设计。我有一个类正在形成一个无法维护的 if 语句
c# - 内联 If 语句中的默认条件
我正在我的 C# 代码中获取一个数据库行。行包含 3 个不同的标志(3 列具有 true 或 false 值)。这些列中只有一列为真，这将决定该对象的类型。我如何在一行代码中确定该对象的类型。如果所有
CSS 字体粗体 - 内联
在 CSS 中，我如何才能只将电话号码加粗，以便它与声明的其余部分内联，但电话号码是加粗的？而不是在 HTML 中这样做: › Start posting jobs today– 0

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城