- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试了解对象在组装级别如何工作。对象如何精确地存储在内存中,成员函数如何访问它们?
(编者注:原始版本过于宽泛,并且一开始就对汇编和结构的工作方式感到困惑。)
最佳答案
类的存储方式与结构完全相同,除非它们具有虚拟成员。在这种情况下,有一个隐式vtable指针作为第一个成员(请参见下文)。
结构存储为连续的内存块(if the compiler doesn't optimize it away or keep the member values in registers)。在struct对象中,其元素的地址按定义成员的顺序增加。 (来源:http://en.cppreference.com/w/c/language/struct)。我链接了C定义,因为在C++中,struct
表示class
(使用public:
代替private:
作为默认值)。
可以将struct
或class
视为一个字节块,该字节块可能太大而无法容纳在寄存器中,但会被复制为“值”。 汇编语言没有类型系统。内存中的字节仅是字节,不需要任何特殊指令即可存储浮点寄存器中的double
并将其重新加载到整数寄存器中。或者执行未对齐的加载,并获得1 int
的最后3个字节和下一个的第一个字节。 struct
只是在内存块顶部构建C的类型系统的一部分,因为内存块很有用。
这些字节块可以具有静态(全局(或全局)或static
),动态((malloc
或new
))或自动存储(局部变量:在常规CPU上的常规C/C++实现中,在堆栈或寄存器中为临时变量)。无论如何,块内的布局都是相同的(除非编译器为struct局部变量优化了实际内存;请参见下面的内联返回struct的函数的示例。)
结构或类与任何其他对象相同。用C和C++术语,甚至int
也是一个对象:http://en.cppreference.com/w/c/language/object。即可以连续存储的连续字节块(C++中的非POD类型除外)。
您要编译的系统的ABI规则指定了插入填充的时间和位置,以确保每个成员都具有足够的对齐方式,即使您执行struct { char a; int b; };
之类的操作(例如,在Linux和其他非Windows系统上使用的the x86-64 System V ABI也会指定该操作) int
是一种32位类型,可在内存中进行4字节对齐 ABI可以使C和C++标准保持“实现依赖”的某些特征,因此该ABI的所有编译器都可以编写可调用的代码彼此的功能。)
请注意,您可以使用 offsetof(struct_name, member)
来查找有关结构布局的信息(在C11和C++ 11中)。另请参见C++ 11中的 alignof
或C11中的_Alignof
。
由于C规则不允许编译器为您对结构进行排序,因此程序员应合理地对结构成员进行排序,以避免浪费填充空间。 (例如,如果您有一些char
成员,请将它们至少分成4个一组,而不是与较宽的成员交替。从大到小的排序是一个简单的规则,请记住,在常见平台上指针可能是64位或32位。)
有关ABI的更多详细信息,请参见https://stackoverflow.com/tags/x86/info。 Agner Fog的excellent site包括ABI指南以及优化指南。
类(具有成员函数)
class foo {
int m_a;
int m_b;
void inc_a(void){ m_a++; }
int inc_b(void);
};
int foo::inc_b(void) { return m_b++; }
foo::inc_b(): # args: this in RDI
mov eax, DWORD PTR [rdi+4] # eax = this->m_b
lea edx, [rax+1] # edx = eax+1
mov DWORD PTR [rdi+4], edx # this->m_b = edx
ret
this
指针作为隐式第一个参数传递(在SysV AMD64 ABI中的rdi中)。
m_b
从struct/class的开始存储在4个字节处。请注意,巧妙地使用
lea
来实现后递增运算符,而将旧值保留在
eax
中。
inc_a
是在类声明中定义的,因此不会发出任何代码。它被视为与
inline
非成员函数相同。如果确实很大,并且编译器决定不内联它,则它可以发出它的独立版本。
class foo {
public:
int m_a;
int m_b;
void inc_a(void){ m_a++; }
void inc_b(void);
virtual void inc_v(void);
};
void foo::inc_b(void) { m_b++; }
class bar: public foo {
public:
virtual void inc_v(void); // overrides foo::inc_v even for users that access it through a pointer to class foo
};
void foo::inc_v(void) { m_b++; }
void bar::inc_v(void) { m_a++; }
; This time I made the functions return void, so the asm is simpler
; The in-memory layout of the class is now:
; vtable ptr (8B)
; m_a (4B)
; m_b (4B)
foo::inc_v():
add DWORD PTR [rdi+12], 1 # this_2(D)->m_b,
ret
bar::inc_v():
add DWORD PTR [rdi+8], 1 # this_2(D)->D.2657.m_a,
ret
# if you uncheck the hide-directives box, you'll see
.globl foo::inc_b()
.set foo::inc_b(),foo::inc_v()
# since inc_b has the same definition as foo's inc_v, so gcc saves space by making one an alias for the other.
# you can also see the directives that define the data that goes in the vtables
add m32, imm8
比
inc m32
更快(负载+ ALU运算符的微融合);很少有旧的Pentium4建议避免
inc
的情况之一仍然适用。 gcc始终避免使用
inc
,即使它可以节省代码大小且没有缺点:/
INC instruction vs ADD 1: Does it matter?
void caller(foo *p){
p->inc_v();
}
mov rax, QWORD PTR [rdi] # p_2(D)->_vptr.foo, p_2(D)->_vptr.foo
jmp [QWORD PTR [rax]] # *_3
jmp
代替
call
/
ret
)。
mov
将对象的vtable地址加载到寄存器中。
jmp
是内存间接跳转,即从内存中加载新的RIP值。
跳转目标地址是vtable[0]
,即vtable中的第一个函数指针。 如果存在另一个虚拟函数,则
mov
不会更改,但
jmp
将使用
jmp [rax + 8]
。
foo *
始终指向
bar
对象,则可以内联
bar::inc_v()
。
bar
继承的类,因此可以肯定地认为
bar*
指向
bar
对象,而不是某些派生类。
void caller_bar(bar *p){
p->inc_v();
}
# gcc5.5 -O3
caller_bar(bar*):
mov rax, QWORD PTR [rdi] # load vtable pointer
mov rax, QWORD PTR [rax] # load target function address
cmp rax, OFFSET FLAT:bar::inc_v() # check it
jne .L6 #,
add DWORD PTR [rdi+8], 1 # inlined version of bar::inc_v()
ret
.L6:
jmp rax # otherwise tailcall the derived class's function
foo *
实际上可以指向派生的
bar
对象,但是
bar *
不允许指向纯
foo
对象。
bar::inc_v()
。覆盖其他虚拟函数不会影响这一功能,但是需要使用不同的vtable。
enum
+ switch
或
std::variant<D1,D2>
进行联合,并通过
std::visit
进行分派(dispatch),或者进行其他操作方法。另请参见
Contiguous storage of polymorphic types和
Fastest implementation of simple, virtual, observer-sort of, pattern in c++?。
struct
不会强制编译器将东西实际放入内存中,这比小型数组或指向局部变量的指针要多。例如,按值返回
struct
的内联函数仍可以完全优化。
struct pair {
int m_a;
int m_b;
};
pair addsub(int a, int b) {
return {a+b, a-b};
}
int foo(int a, int b) {
pair ab = addsub(a,b);
return ab.m_a * ab.m_b;
}
# The non-inline definition which actually returns a struct
addsub(int, int):
lea edx, [rdi+rsi] # add result
mov eax, edi
sub eax, esi # sub result
# then pack both struct members into a 64-bit register, as required by the x86-64 SysV ABI
sal rax, 32
or rax, rdx
ret
# But when inlining, it optimizes away
foo(int, int):
lea eax, [rdi+rsi] # a+b
sub edi, esi # a-b
imul eax, edi # (a+b) * (a-b)
ret
关于c++ - 对象在 assembly 级的x86中如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33556511/
我需要将文本放在 中在一个 Div 中,在另一个 Div 中,在另一个 Div 中。所以这是它的样子: #document Change PIN
奇怪的事情发生了。 我有一个基本的 html 代码。 html,头部, body 。(因为我收到了一些反对票,这里是完整的代码) 这是我的CSS: html { backgroun
我正在尝试将 Assets 中的一组图像加载到 UICollectionview 中存在的 ImageView 中,但每当我运行应用程序时它都会显示错误。而且也没有显示图像。 我在ViewDidLoa
我需要根据带参数的 perl 脚本的输出更改一些环境变量。在 tcsh 中,我可以使用别名命令来评估 perl 脚本的输出。 tcsh: alias setsdk 'eval `/localhome/
我使用 Windows 身份验证创建了一个新的 Blazor(服务器端)应用程序,并使用 IIS Express 运行它。它将显示一条消息“Hello Domain\User!”来自右上方的以下 Ra
这是我的方法 void login(Event event);我想知道 Kotlin 中应该如何 最佳答案 在 Kotlin 中通配符运算符是 * 。它指示编译器它是未知的,但一旦知道,就不会有其他类
看下面的代码 for story in book if story.title.length < 140 - var story
我正在尝试用 C 语言学习字符串处理。我写了一个程序,它存储了一些音乐轨道,并帮助用户检查他/她想到的歌曲是否存在于存储的轨道中。这是通过要求用户输入一串字符来完成的。然后程序使用 strstr()
我正在学习 sscanf 并遇到如下格式字符串: sscanf("%[^:]:%[^*=]%*[*=]%n",a,b,&c); 我理解 %[^:] 部分意味着扫描直到遇到 ':' 并将其分配给 a。:
def char_check(x,y): if (str(x) in y or x.find(y) > -1) or (str(y) in x or y.find(x) > -1):
我有一种情况,我想将文本文件中的现有行包含到一个新 block 中。 line 1 line 2 line in block line 3 line 4 应该变成 line 1 line 2 line
我有一个新项目,我正在尝试设置 Django 调试工具栏。首先,我尝试了快速设置,它只涉及将 'debug_toolbar' 添加到我的已安装应用程序列表中。有了这个,当我转到我的根 URL 时,调试
在 Matlab 中,如果我有一个函数 f,例如签名是 f(a,b,c),我可以创建一个只有一个变量 b 的函数,它将使用固定的 a=a1 和 c=c1 调用 f: g = @(b) f(a1, b,
我不明白为什么 ForEach 中的元素之间有多余的垂直间距在 VStack 里面在 ScrollView 里面使用 GeometryReader 时渲染自定义水平分隔线。 Scrol
我想知道,是否有关于何时使用 session 和 cookie 的指南或最佳实践? 什么应该和什么不应该存储在其中?谢谢! 最佳答案 这些文档很好地了解了 session cookie 的安全问题以及
我在 scipy/numpy 中有一个 Nx3 矩阵,我想用它制作一个 3 维条形图,其中 X 轴和 Y 轴由矩阵的第一列和第二列的值、高度确定每个条形的 是矩阵中的第三列,条形的数量由 N 确定。
假设我用两种不同的方式初始化信号量 sem_init(&randomsem,0,1) sem_init(&randomsem,0,0) 现在, sem_wait(&randomsem) 在这两种情况下
我怀疑该值如何存储在“WORD”中,因为 PStr 包含实际输出。? 既然Pstr中存储的是小写到大写的字母,那么在printf中如何将其给出为“WORD”。有人可以吗?解释一下? #include
我有一个 3x3 数组: var my_array = [[0,1,2], [3,4,5], [6,7,8]]; 并想获得它的第一个 2
我意识到您可以使用如下方式轻松检查焦点: var hasFocus = true; $(window).blur(function(){ hasFocus = false; }); $(win
我是一名优秀的程序员,十分优秀!