- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
对于以下代码:
long buf[64];
register long rrax asm ("rax");
register long rrbx asm ("rbx");
register long rrsi asm ("rsi");
rrax = 0x34;
rrbx = 0x39;
__asm__ __volatile__ ("movq $buf,%rsi");
__asm__ __volatile__ ("movq %rax, 0(%rsi);");
__asm__ __volatile__ ("movq %rbx, 8(%rsi);");
printf( "buf[0] = %lx, buf[1] = %lx!\n", buf[0], buf[1] );
buf[0] = 0, buf[1] = 346161cbc0!
buf[0] = 34, buf[1] = 39!
最佳答案
您破坏内存但不告诉 GCC,因此 GCC 可以缓存 buf
中的值跨程序集调用。如果你想使用输入和输出,告诉 GCC 一切。
__asm__ (
"movq %1, 0(%0)\n\t"
"movq %2, 8(%0)"
: /* Outputs (none) */
: "r"(buf), "r"(rrax), "r"(rrbx) /* Inputs */
: "memory"); /* Clobbered */
您通常还希望让 GCC 处理大部分
mov
,寄存器选择等——即使你明确限制寄存器(rrax 仍然是
%rax
)让信息流过 GCC,否则你会得到意想不到的结果。
__volatile__
是错的。
__volatile__
存在是这样你就可以保证编译器将你的代码准确地放置在它所在的位置......这对这段代码来说是完全不必要的保证。它对于实现诸如内存屏障之类的高级功能是必要的,但如果您只是修改内存和寄存器,则几乎完全没有值(value)。
printf
之后它不能移动这个程序集因为
printf
调用接入
buf
, 和
buf
可能会被议会破坏。 GCC在
rrax=0x39;
之前已经知道它不能移动程序集因为
rax
是汇编代码的输入。那么
__volatile__
有什么用明白?没有什么。
__volatile__
的情况下不起作用那么代码中有错误应该是
固定 而不是仅仅添加
__volatile__
并希望这能让一切变得更好。
__volatile__
关键字不是魔术,不应被视为魔术。
__volatile__
您的原始代码需要吗?不。只需正确标记输入和破坏值。
/* The "S" constraint means %rsi, "b" means %rbx, and "a" means %rax
The inputs and clobbered values are specified. There is no output
so that section is blank. */
rsi = (long) buf;
__asm__ ("movq %%rax, 0(%%rsi)" : : "a"(rrax), "S"(rssi) : "memory");
__asm__ ("movq %%rbx, 0(%%rsi)" : : "b"(rrbx), "S"(rrsi) : "memory");
为什么
__volatile__
在这里对您没有帮助:
rrax = 0x34; /* Dead code */
GCC 完全有权完全删除上述行,因为上述问题中的代码声称它从不使用
rrax
.
long global;
void store_5(void)
{
register long rax asm ("rax");
rax = 5;
__asm__ __volatile__ ("movq %%rax, (global)");
}
拆卸或多或少如您所料
-O0
,
movl $5, %rax
movq %rax, (global)
但是在关闭优化的情况下,您可能对 assembly 相当草率。让我们试试
-O2
:
movq %rax, (global)
哎呀!哪里去了
rax = 5;
去?这是死代码,因为
%rax
从未在函数中使用——至少就 GCC 而言是这样。 GCC 不会查看程序集内部。当我们删除
__volatile__
时会发生什么?
; empty
好吧,你可能会想
__volatile__
通过防止 GCC 丢弃您宝贵的程序集来为您提供服务,但这只是掩盖了 GCC 认为您的程序集没有做任何事情的事实。 GCC 认为你的程序集不接受输入,不产生输出,并且不破坏内存。你最好把它弄直:
long global;
void store_5(void)
{
register long rax asm ("rax");
rax = 5;
__asm__ __volatile__ ("movq %%rax, (global)" : : : "memory");
}
现在我们得到以下输出:
movq %rax, (global)
更好的。但是如果你告诉 GCC 有关输入的信息,它会确保
%rax
首先正确初始化:
long global;
void store_5(void)
{
register long rax asm ("rax");
rax = 5;
__asm__ ("movq %%rax, (global)" : : "a"(rax) : "memory");
}
输出,经过优化:
movl $5, %eax
movq %rax, (global)
正确的!我们甚至不需要使用
__volatile__
.
__volatile__
存在?
__volatile__
的主要正确用法是如果您的汇编代码除了输入、输出或破坏内存之外还执行其他操作。也许它会混淆 GCC 不知道的特殊寄存器,或者影响 IO。您在 Linux 内核中经常看到它,但它在用户空间中经常被误用。
__volatile__
关键字非常诱人,因为我们 C 程序员常常认为我们几乎已经在用汇编语言编程了。不是。 C 编译器会进行大量数据流分析——因此您需要向编译器解释汇编代码的数据流。这样,编译器就可以安全地操作您的程序集 block ,就像它操作它生成的程序集一样。
__volatile__
很多,作为替代方案,您可以在程序集文件中编写整个函数或模块。
关于c - 为什么这个内联汇编不能为每条指令使用单独的 asm volatile 语句?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8891139/
这将是一篇很长的文章,为了将其上下文化并提供尽可能多的信息,我必须仔细浏览各种链接和引号——这通常是我们进入 C/C++ 标准兔子洞的唯一方法。如果您对这篇文章有更好的引用或任何其他改进,请告诉我。但
我想知道 volatile 关键字与 register、const 和 static 结合的不同用途关键词。我不确定有什么影响,所以我认为: register volatile int T=10; 建
让我们考虑以下 Java 代码 int x = 0; int who = 1 Thread #1: (1) x++; (2) who = 2; Thread #2 while(who
有一个函数“remove_cv”(http://en.cppreference.com/w/cpp/types/remove_cv)可以删除常量和 volatile 。 我的问题是为什么可以从“con
我正在尝试在下面的“MpscQueue.h”中的嵌入式目标上实现多个生产者(通过中断)、单个消费者(通过应用程序线程)队列。 我想知道我是否可以安全地删除一些 volatile下面的用法(见内联问
我的问题适用于最初为 null 的字段,然后初始化为非 null 值,然后不再更改。 由于该字段需要尽快可供所有线程使用,因此我需要使用 volatile 。 但是,如果我想尽可能避免 volatil
我以前见过几次类似 fld = fld 的东西,但在所有这些情况下,可以消除虚拟写入并获得更好的性能。 public class Tst{ public volatile int fld =
看完this question和 this (尤其是第二个答案)我对 volatile 及其与内存屏障有关的语义感到非常困惑。 在上面的例子中,我们写入了一个 volatile 变量,这会导致一个 m
如下所示,该程序有一个共享 var flag,但不带 volatile : public class T { public static void main(String[] args) {
我明白声明 int *volatile ptr; 表示指针本身是volatile int a=10; int *volatile ptr=&a; 现在 ptr 和 a 都在更新。会不会导致访问ptr时
最近我需要比较两个 uint 数组(一个是 volatile 数组,另一个是非 volatile 数组),结果令人困惑,我一定是对 volatile 数组有一些误解。 我需要从输入设备读取一个数组并将
这两个 C 定义有什么区别? volatile uint32_t *ptr1 = (volatile uint32_t *)0x20040000; volatile uint32_t *ptr1 =
// structure is like this, but not exact formation. class queue { volatile List worksWaiting; }
考虑以下这段代码: struct S{ int i; S(int); S(const volatile S&); }; struct S_bad{ int i; }; vola
在 Windows x64 上,考虑到一些额外的见解,何时允许编译器将 ABI 标记为 volatile 的寄存器视为非 volatile 寄存器?我有一个反汇编函数,其中 r11 用于在函数调用后恢
我对下面的代码段有疑问。结果可能有 [0, 1, 0] 的结果(这是用 JCStress 执行的测试)。那么这怎么会发生呢?我认为应该在写入 Actor2 (guard2 = 1) 中的 guard2
好吧,假设我有一堆变量,其中一个声明为 volatile: int a; int b; int c; volatile int v; 如果一个线程写入所有四个变量(最后写入 v),而另一个线程读取所有
我试图理解为什么这个例子是一个正确同步的程序: a - volatile Thread1: x=a Thread2: a=5 因为存在冲突访问(存在对 a 的写入和读取),所以在每个顺序一致性执行中,
我正在编写一个需要同时支持 volatile 和非 volatile 实例的类( volatile 实例使用原子操作,非 volatile 实例使用常规操作),并且想知道我是否以正确的方式进行处理。到
我正在为 Cortex-M0 CPU 和 gcc 编写代码。我有以下结构: struct { volatile unsigned flag1: 1; unsigned flag2: 1
我是一名优秀的程序员,十分优秀!