assembly - 如何知道汇编代码正在使用 RAM？-6ren

assembly - 如何知道汇编代码正在使用 RAM？

转载作者：行者123 更新时间：2023-12-03 06:31:45

我对汇编非常陌生，这是一个基本问题。

我刚刚听说过使用 zero bytes of RAM 的概念.

我通过

编译了 C++ 代码

g++ -O3 main.cpp -S -o main3.s

main.cpp (source)

#include <iostream>
using namespace std;

int main()
{
    int low=10, high=100, i, flag;

    cout << "Prime numbers between " << low << " and " << high << " are: ";

    while (low < high)
    {
        flag = 0;

        for(i = 2; i <= low/2; ++i)
        {
            if(low % i == 0)
            {
                flag = 1;
                break;
            }
        }

        if (flag == 0)
            cout << low << " ";

        ++low;
    }

    return 0;
}

结果如下:

main3.s

    .file   "main.cpp"
    .section    .rodata.str1.1,"aMS",@progbits,1
.LC0:
    .string "Prime numbers between "
.LC1:
    .string " and "
.LC2:
    .string " are: "
.LC3:
    .string " "
    .section    .text.startup,"ax",@progbits
    .p2align 4,,15
    .globl  main
    .type   main, @function
main:
.LFB1561:
    .cfi_startproc
    pushq   %rbx
    .cfi_def_cfa_offset 16
    .cfi_offset 3, -16
    movl    $22, %edx
    movl    $.LC0, %esi
    movl    $_ZSt4cout, %edi
    call    _ZSt16__ostream_insertIcSt11char_traitsIcEERSt13basic_ostreamIT_T0_ES6_PKS3_l
    movl    $10, %esi
    movl    $_ZSt4cout, %edi
    call    _ZNSolsEi
    movl    $5, %edx
    movq    %rax, %rbx
    movl    $.LC1, %esi
    movq    %rax, %rdi
    call    _ZSt16__ostream_insertIcSt11char_traitsIcEERSt13basic_ostreamIT_T0_ES6_PKS3_l
    movq    %rbx, %rdi
    movl    $100, %esi
    movl    $10, %ebx
    call    _ZNSolsEi
    movl    $.LC2, %esi
    movq    %rax, %rdi
    call    _ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc
    .p2align 4,,10
    .p2align 3
.L6:
    movl    %ebx, %esi
    sarl    %esi
    testb   $1, %bl
    je  .L2
    movl    $2, %ecx
    jmp .L3
    .p2align 4,,10
    .p2align 3
.L14:
    movl    %ebx, %eax
    cltd
    idivl   %ecx
    testl   %edx, %edx
    je  .L2
.L3:
    addl    $1, %ecx
    cmpl    %esi, %ecx
    jle .L14
    movl    %ebx, %esi
    movl    $_ZSt4cout, %edi
    call    _ZNSolsEi
    movl    $1, %edx
    movl    $.LC3, %esi
    movq    %rax, %rdi
    call    _ZSt16__ostream_insertIcSt11char_traitsIcEERSt13basic_ostreamIT_T0_ES6_PKS3_l
.L2:
    addl    $1, %ebx
    cmpl    $100, %ebx
    jne .L6
    xorl    %eax, %eax
    popq    %rbx
    .cfi_def_cfa_offset 8
    ret
    .cfi_endproc
.LFE1561:
    .size   main, .-main
    .p2align 4,,15
    .type   _GLOBAL__sub_I_main, @function
_GLOBAL__sub_I_main:
.LFB2045:
    .cfi_startproc
    subq    $8, %rsp
    .cfi_def_cfa_offset 16
    movl    $_ZStL8__ioinit, %edi
    call    _ZNSt8ios_base4InitC1Ev
    movl    $__dso_handle, %edx
    movl    $_ZStL8__ioinit, %esi
    movl    $_ZNSt8ios_base4InitD1Ev, %edi
    addq    $8, %rsp
    .cfi_def_cfa_offset 8
    jmp __cxa_atexit
    .cfi_endproc
.LFE2045:
    .size   _GLOBAL__sub_I_main, .-_GLOBAL__sub_I_main
    .section    .init_array,"aw"
    .align 8
    .quad   _GLOBAL__sub_I_main
    .local  _ZStL8__ioinit
    .comm   _ZStL8__ioinit,1,1
    .hidden __dso_handle
    .ident  "GCC: (Ubuntu 7.2.0-1ubuntu1~16.04) 7.2.0"
    .section    .note.GNU-stack,"",@progbits

这是一个基本程序，可以将所有变量存储到CPU寄存器中。因此，我猜它不使用RAM。我想知道检查汇编代码是否使用 RAM 的标准是什么？

最佳答案

在您链接的剪辑中，Jason Turner 只是说 C 局部变量都适合寄存器，因此编译器不必花费额外的指令 spilling/reloading them .

它使用 RAM 来存储代码和数据，只是不使用任何堆栈内存来存储局部变量。即局部变量的 RAM 为零，当然总共不是零字节。他甚至说游戏编译为 1005 字节(代码 + 数据)。

<小时/>

在读取 asm 时，您可以通过注意到堆栈中缺少加载/存储来检测到这一点，例如在 x86-64 上使用 RSP(或 RBP，如果用作帧指针)的寻址模式。

对于不太大的函数来说，这是完全正常的。否则，内联函数调用是实现这一目标的关键，因为在调用非内联函数时，编译器通常必须使内存“同步”(反射(reflect) C 抽象机的正确值)。

int foo(int num) {
    int tmp = num * num;
    return tmp;
}

在寄存器中获取num，并将tmp保存在那里。 Jason 的演讲使用的是 Godbolt，因此这里有一个链接 the same function on Godbolt ，由 gcc7.3 编译，经过优化和未经优化:

 foo:   # with optimization: all operands are registers
    imul    edi, edi
    mov     eax, edi
    ret

foo:    # without optimization:
    push    rbp
    mov     rbp, rsp                     # make a stack frame with RBP
    mov     DWORD PTR [rbp-20], edi      # spill num to the stack
      # start of code for first C statement
    mov     eax, DWORD PTR [rbp-20]      # reload it
    imul    eax, DWORD PTR [rbp-20]      # and use it from memory again
    mov     DWORD PTR [rbp-4], eax       # spill tmp to the stack
      # end of first C statement

    mov     eax, DWORD PTR [rbp-4]       # load tmp into the return value register, eax)
    pop     rbp
    ret

这不需要使用 sub rsp, 24 来保留任何堆栈空间，因为它使用 RSP 下面的红色区域来处理溢出/重新加载的局部变量。

显然，启用优化后，即使编译器在大型复杂函数中耗尽了寄存器并且必须溢出某些内容，您也不会得到如此糟糕的代码。 -O0 是一种反优化模式，其中每个 C 语句都会获得一个单独的 asm block ，因此您可以设置断点并修改变量，并使代码仍然有效。或者甚至跳转到 gdb 中的不同源代码行!

<小时/>

回复:x86 有多少个寄存器，如演讲中所述:

i386 有 8 个架构整数寄存器。它有一些段寄存器，您可以滥用它来保留额外的值，如果它有 FPU，则有 8 个 x87 80 位 FP 堆栈寄存器。 Jason 对 16 的猜测听起来很假，但他可能将 AL/AH、BL/BH 作为单独的 8 位寄存器进行计数，因为您可以独立使用它们。但不能与 EAX 同时使用，因为窄寄存器是完整寄存器的子集。

(并注意 partial-register penalties on various modern microarchitectures 。在 AMD 上，AL 和 AH 根本不独立；使用其中之一会错误地依赖于另一个，即整个 EAX/RAX。在 Pentium P5MMX 及以上版本的 CPU 上，根本不存在部分寄存器惩罚，因为没有乱序执行或寄存器重命名。)

他声称现代 x86-64 有数百个寄存器也绝对是假的，除非你计算所有控制寄存器和特定于模型的寄存器。但堆栈内存比这些寄存器快得多，并且无论如何您都不能在其中放入任意值。由于只有 16 个架构整数寄存器(其中之一是堆栈指针，因此您实际上可以在一个大函数中使用 15 个寄存器)，当您一次需要更多变量“实时”时，您仍然需要额外的指令来溢出或至少重新加载内容比那。

将寄存器重命名到大量物理寄存器上非常棒，并且 essential along with a large ReOrder Buffer for a large out-of-order execution window找到指令级并行性。但是您只能通过为不同的值重复使用相同的整数寄存器来利用这些寄存器。 (即 register renaming avoids write-after-read and write-after-write hazards ，使同一寄存器的两次使用实际上是独立的。)

Haswell 有一个用于整数/GP 寄存器的 168 项物理寄存器文件，还有一个用于重命名 FP/矢量寄存器的 168 项向量/FP 寄存器文件。 https://www.realworldtech.com/haswell-cpu/3/ 。但从架构上来说，在 x86-64 模式下运行时，它只有 16 GP/16 YMM，在 ia-32 模式下只有 8/8。

关于assembly - 如何知道汇编代码正在使用 RAM？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49807965/

文章推荐： CKEditor 自定义插件按钮

文章推荐： firefox - 访问Firefox扩展/附加组件的脚本

文章推荐： android - 复制一个android studio项目

文章推荐： facebook - 收到警报此评论尚未发布到 Facebook。发表评论

assembly - "Assembly"与 "Assembler"
我被告知“汇编”是您在文件中编写的内容，让您的“汇编程序”将其转换为二进制代码。但我看到这两个术语在各种作品中混合搭配。我什至听说你编写了“汇编器”，然后“汇编器”使其可执行。正确的用词是什么？
assembly - 如何正确结束 assembly ？
我在正确终止用 Assembly 编写的 16 位 DOS 程序时遇到问题。这是部分代码: .386P .model flat stack_s segment stack 'stack'
assembly - assembly 流水线
我需要多少档才能正确执行以下指令。我对我所做的事情有些困惑，所以我在这里看到专家的答案。 lw $1,0($2); beq $1,$2,Label; 请注意，检查是否会发生分支将在解码阶段完成。但是在
assembly - assembly 中的MUL功能
我正在尝试在汇编中进行简单的乘法运算，但是由于某些原因，当标记了MUL函数时，我看不到寄存器会发生变化。 mov bx, 5 mov cx, 10 mul cx 最佳答案这些称为指令，它们指定
assembly - assembly 中的递归斐波那契
我正在尝试在 Assembly 中实现递归斐波那契程序。但是，我的程序崩溃了，出现了未处理的异常，我似乎无法找出问题所在。我不怀疑这涉及我对堆栈的不当使用，但我似乎无法指出哪里...... .386
assembly - assembly 中出现奇怪的字符？
我编写了以下代码: .386 .model small .stack 100h .data text db "Paper",0 .code start : lea dx ,
assembly - assembly 中的搬迁
我有一个用汇编语言编写的裸机 ARM 的启动代码，我正在尝试了解它是如何工作的。该二进制文件被写入一些外部闪存中，并在启动时将其自身的一部分复制到 RAM 中。尽管我读过这篇文章wikipedia e
assembly - assembly 中的二维数组
我在数据部分定义了一个二维数组和两个一维数组(一个用于列总和，一个用于行总和)，并且我编写了一个函数，将二维数组求和到一维数组中。我使用 eax 和 ebx 作为二维数组的索引，但是当 eax 或 e
assembly - assembly 中的双重条件检查
我正在开始组装，我正在使用 nasm 来组装代码，我正在尝试处理驻留在内存中的字符串并更改它，我想检查一个字节是否在某个范围内(ascii)，这样我就可以决定如何处理它，我似乎不知道如何检查一个值是否
assembly - assembly 分离过多的迹象是什么？
虽然您通常不希望将一个整体程序集用于小型项目以外的任何事情，但可能会将事物分离得太多。组装分离过多的迹象/气味是什么？最佳答案第一个(明显的)是:在一个有很多项目的解决方案中，其中只有少数(比如
assembly - assembly 中的斐波那契实现给出了意想不到的结果
我正在尝试编写斐波那契的汇编代码版本，它给出第 n 个斐波那契数并返回它。出于某种原因，它在存储斐波那契数的返回值和添加它们时遇到问题。我希望它打印第 n 个斐波那契数。我对我的代码做了一些修改
c# - Assembly.LoadFile、Assembly.LoadFrom 和 Assembly.Load 的替代方案？
我有一个最小的、可重现的示例有两个问题，该示例具有三个针对 .NET Core 3.1 的项目。但我也想以 .NET Standard 2.0 为目标。该示例适用于需要在运行时加载程序集并使用提供的
assembly - : operator do in assembly? 是什么
: 运算符在汇编中做什么？代码如下:DS:DX我还没有找到该运算符(operator)的任何文档。(我正在使用 NASM) 最佳答案那实际上只是一个寄存器分隔符，而不是运算符。这意味着使用 DX 寄
assembly - GMP- assembly 代码？
我在哪里可以找到为 gmp-5.0.0 编写的程序的汇编代码我正在使用 UBUNTU 和 G++ 编译器..编译代码的命令是“g++ test.cc -o outp -lgmp” 实际上我想知道在 1
assembly - 如何计算 assembly 中的负数
我是组装新手，我有一个关于如何表示负数的问题我有三个 DWORDS 变量，比如说: result DWORD 0 i DWORD 3 j DWORD 5 我想计算这个公式:result = i -
assembly - 基本 assembly 程序
我想编写我的第一个汇编程序。我在论文上做了一些程序，但这是我第一次使用编译器。我正在使用 ideone .我的程序很简单，翻译 A = 5 - A到 assembly NEG A ADD A, 5
assembly - 打印存储在字节中的值的宏。 assembly 体
程序集，masm 嘿，我写了宏来打印存储在 dane1 段中的 1 字节值。我将值除以 16，然后将提醒推送到堆栈，直到值==0。然后我弹出提醒将它们转换为 ASCII 码，并打印它们。有人可以看
assembly - assembly NASM 中的随机数生成
我正在研究 nasm 的一个大学项目。唯一的问题是我无法生成 162 和 278 之间的偶数随机数。我尝试了很多算法，但似乎无法限制范围内的数字。是否有一个小技巧或调整来获得所需的范围内的数字？目的
assembly - assembly x86 中的斐波那契数列
终于在无数次错误的漫长 session 之后，希望这是最后一个。没有编译或运行时错误，只是一个逻辑错误。编辑:(固定伪代码) 我的伪代码: first = 1; second = 1; thir
assembly - Arm Assembly-带有4个以上参数的调用函数
我知道在程序集r0中调用函数时，包含第一个参数，直到r3是第四个。我知道，当它超过四个时，将使用堆栈指针，但是我不太确定具体细节。 r0-r3仍然保持前四个，其余的进入堆栈吗？我正在看下面的程序集，试

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

assembly - 如何知道汇编代码正在使用 RAM？