c++ - 编译器会做什么-6ren

c++ - 编译器会做什么

转载作者：太空宇宙更新时间：2023-11-04 05:02:06

我已经编程了几年，但令人尴尬的是，有一两件事我仍然不完全清楚。

下面的基本代码只是作为例子，当编译器遇到myFunc()时，str1和str2会存放到哪里呢？

它们是指向字符串文字的指针，所以我假设字符串文字将存储在只读内存中，但在这种情况下，一个指针是静态本地指针而另一个不是静态本地指针有什么区别？另外，我认为局部变量将存储在堆栈中，并且在调用函数之前不会分配它们？这令人困惑。

对于整数 var1，它是非静态的，但 var2 是静态的。编译器会不会在编译的时候把这个var2放到data段中。我读过另一篇文章 When do function-level static variables get allocated/initialized? ，局部静态变量将在第一次使用时创建和初始化，而不是在编译期间。那么在那种情况下，如果函数从未被调用怎么办？

提前感谢经验丰富的知识。

已编辑:从 main() 调用 myFunc()。这是一个打字错误，因为 myFunc() 甚至从未被调用过

int myFunc()
{
    static char* str1 = "Hello";
    char* str2 = "World";

    int var1 = 1;
    static int var2 = 8;

}

int main()
{

    return myFunc();
}

最佳答案

编辑:

~~其他答案和评论是正确的 - 实际上，您的变量将被优化掉，因为它们甚至没有被使用。但让我们找点乐子，实际使用它们看看会发生什么。~~

我使用 gcc -S trial.c 按原样编译了 op 的程序，尽管从未调用过 myFunc，但此答案没有其他任何变化。

我稍微修改了您的程序以实际使用这些变量，这样我们就可以更多地了解编译器和链接器将做什么。在这里:

#include <stdio.h>

int myFunc()
{
    static const char* str1 = "Hello";
    const char* str2 = "World";

    int var1 = 1;
    static int var2 = 8;
    printf("%s %s %d %d\n", str1, str2, var1, var2);
    return 0;
}

int main()
{
    return myFunc();
}

我用 gcc -S trial.c 编译并得到以下汇编文件:

    .file   "trial.c"
    .section .rdata,"dr"
.LC0:
    .ascii "World\0"
.LC1:
    .ascii "%s %s %d %d\12\0"
    .text
    .globl  myFunc
    .def    myFunc; .scl    2;  .type   32; .endef
    .seh_proc   myFunc
myFunc:
    pushq   %rbp
    .seh_pushreg    %rbp
    movq    %rsp, %rbp
    .seh_setframe   %rbp, 0
    subq    $64, %rsp
    .seh_stackalloc 64
    .seh_endprologue
    leaq    .LC0(%rip), %rax
    movq    %rax, -8(%rbp)
    movl    $1, -12(%rbp)
    movl    var2.3086(%rip), %edx
    movq    str1.3083(%rip), %rax
    movl    -12(%rbp), %r8d
    movq    -8(%rbp), %rcx
    movl    %edx, 32(%rsp)
    movl    %r8d, %r9d
    movq    %rcx, %r8
    movq    %rax, %rdx
    leaq    .LC1(%rip), %rcx
    call    printf
    movl    $0, %eax
    addq    $64, %rsp
    popq    %rbp
    ret
    .seh_endproc
    .def    __main; .scl    2;  .type   32; .endef
    .globl  main
    .def    main;   .scl    2;  .type   32; .endef
    .seh_proc   main
main:
    pushq   %rbp
    .seh_pushreg    %rbp
    movq    %rsp, %rbp
    .seh_setframe   %rbp, 0
    subq    $32, %rsp
    .seh_stackalloc 32
    .seh_endprologue
    call    __main
    call    myFunc
    addq    $32, %rsp
    popq    %rbp
    ret
    .seh_endproc
    .data
    .align 4
var2.3086:
    .long   8
    .section .rdata,"dr"
.LC2:
    .ascii "Hello\0"
    .data
    .align 8
str1.3083:
    .quad   .LC2
    .ident  "GCC: (Rev1, Built by MSYS2 project) 5.4.0"
    .def    printf; .scl    2;  .type   32; .endef

var1 甚至没有在程序集文件中找到。它实际上只是一个加载到堆栈上的常量。

在程序集文件的顶部，我们在 .rdata 部分中看到“World”(str2)。在汇编文件的下方，字符串“Hello”位于 .rdata 部分，但 str1 的标签(包含“Hello”的标签或地址)位于 .data 部分。 var2 也在 .data 部分。

这是 a stackoverflow question这更深入地研究了为什么会发生这种情况。

Another stackoverflow question指出 .rdata 部分是 .data 的只读部分，并解释了不同的部分。

希望这对您有所帮助。

编辑:

我决定尝试使用 -O3 编译器标志(高度优化)。这是我得到的程序集文件:

    .file   "trial.c"
    .section .rdata,"dr"
.LC0:
    .ascii "World\0"
.LC1:
    .ascii "Hello\0"
.LC2:
    .ascii "%s %s %d %d\12\0"
    .section    .text.unlikely,"x"
.LCOLDB3:
    .text
.LHOTB3:
    .p2align 4,,15
    .globl  myFunc
    .def    myFunc; .scl    2;  .type   32; .endef
    .seh_proc   myFunc
myFunc:
    subq    $56, %rsp
    .seh_stackalloc 56
    .seh_endprologue
    leaq    .LC0(%rip), %r8
    leaq    .LC1(%rip), %rdx
    leaq    .LC2(%rip), %rcx
    movl    $8, 32(%rsp)
    movl    $1, %r9d
    call    printf
    nop
    addq    $56, %rsp
    ret
    .seh_endproc
    .section    .text.unlikely,"x"
.LCOLDE3:
    .text
.LHOTE3:
    .def    __main; .scl    2;  .type   32; .endef
    .section    .text.unlikely,"x"
.LCOLDB4:
    .section    .text.startup,"x"
.LHOTB4:
    .p2align 4,,15
    .globl  main
    .def    main;   .scl    2;  .type   32; .endef
    .seh_proc   main
main:
    subq    $40, %rsp
    .seh_stackalloc 40
    .seh_endprologue
    call    __main
    xorl    %eax, %eax
    addq    $40, %rsp
    ret
    .seh_endproc
    .section    .text.unlikely,"x"
.LCOLDE4:
    .section    .text.startup,"x"
.LHOTE4:
    .ident  "GCC: (Rev1, Built by MSYS2 project) 5.4.0"
    .def    printf; .scl    2;  .type   32; .endef

var1 现在只是一个放在寄存器 (r9d) 中的常量 1。 var2 也只是一个常量，但它放在堆栈上。此外，以更直接(高效)的方式访问字符串“Hello”和“World”。

所以，我决定尝试一些稍微不同的东西:

#include <stdio.h>

void myFunc()
{
    static const char* str1 = "Hello";
    const char* str2 = "World";

    int var1 = 1;
    static int var2 = 8;
    printf("%s %s %d %d\n", str1, str2, var1, var2);

    var1++;
    var2++;
    printf("%d %d", var1, var2);
}

int main()
{
    myFunc();
    myFunc();
    return 0;
}

以及使用 gcc -O3 -S trial.c 的关联程序集

    .file   "trial.c"
    .section .rdata,"dr"
.LC0:
    .ascii "World\0"
.LC1:
    .ascii "Hello\0"
.LC2:
    .ascii "%s %s %d %d\12\0"
.LC3:
    .ascii "%d %d\0"
    .section    .text.unlikely,"x"
.LCOLDB4:
    .text
.LHOTB4:
    .p2align 4,,15
    .globl  myFunc
    .def    myFunc; .scl    2;  .type   32; .endef
    .seh_proc   myFunc
myFunc:
    subq    $56, %rsp
    .seh_stackalloc 56
    .seh_endprologue
    movl    var2.3086(%rip), %eax
    leaq    .LC0(%rip), %r8
    leaq    .LC1(%rip), %rdx
    leaq    .LC2(%rip), %rcx
    movl    $1, %r9d
    movl    %eax, 32(%rsp)
    call    printf
    movl    var2.3086(%rip), %eax
    leaq    .LC3(%rip), %rcx
    movl    $2, %edx
    leal    1(%rax), %r8d
    movl    %r8d, var2.3086(%rip)
    addq    $56, %rsp
    jmp printf
    .seh_endproc
    .section    .text.unlikely,"x"
.LCOLDE4:
    .text
.LHOTE4:
    .def    __main; .scl    2;  .type   32; .endef
    .section    .text.unlikely,"x"
.LCOLDB5:
    .section    .text.startup,"x"
.LHOTB5:
    .p2align 4,,15
    .globl  main
    .def    main;   .scl    2;  .type   32; .endef
    .seh_proc   main
main:
    subq    $40, %rsp
    .seh_stackalloc 40
    .seh_endprologue
    call    __main
    call    myFunc
    call    myFunc
    xorl    %eax, %eax
    addq    $40, %rsp
    ret
    .seh_endproc
    .section    .text.unlikely,"x"
.LCOLDE5:
    .section    .text.startup,"x"
.LHOTE5:
    .data
    .align 4
var2.3086:
    .long   8
    .ident  "GCC: (Rev1, Built by MSYS2 project) 5.4.0"
    .def    printf; .scl    2;  .type   32; .endef

这看起来有点像原来的样子。 var1 仍然优化为常量，但 var2 现在再次位于 .data 部分。 “Hello”和“World”仍在 .rdata 部分中，因为它们是常量。

其中一条评论指出，在具有不同编译器的不同平台上，这会有所不同。我鼓励您尝试一下。

关于c++ - 编译器会做什么，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39515911/

文章推荐： javascript - Jquery 过滤器作为 css 结构伪类的替代品

文章推荐： c++ - 有没有标准的 Linux C++ 输入库可供使用？

文章推荐： python - Scrapy 项目管道并行或顺序执行 process_item

c++ - 内存对齐 - Sparc(Sun) cc 编译器、Intel(Linux) g++ 编译器、Intel(Windows) MVSC 编译器
我的问题由两部分组成。我注意到使用 cc 编译器的 sparc(sun) 上的 memalign(block_size,bytes) 不检查字节是否为 2 的幂，这与使用 mvsc 编译器的 int
c# - 什么是好的 C# 编译器-编译器/解析器生成器？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 6 年前。
java - Maven 无法定位 Javac 编译器 - 无法在 : 中定位 Javac 编译器
当我尝试在我的 gwt-maven Projekt 上进行 maven-install 时，我得到了这个错误: [ERROR] Failed to execute goal org.apache.ma
c# - 如何使用 csc(C# 编译器)或 dmcs(mono C# 编译器)生成 IL 源代码？
gcc 有一个选项 -s 来生成汇编源代码。 csc(MS C# 编译器)或 dmcs(mono C# 编译器)是否等价？我的意思是那些编译器是否提供了一个选项来生成可以读取而不是执行二进制文件的 I
c - Matlab simulink 无法找到 Stateflow 和 MATLAB Function 模块所需的 C 编译器。使用 'mex -setup' 选择支持的 C 编译器
我在 matlab simulink 中有一个模型。我把matlab安装在D盘了。当我运行模型时，出现以下错误: Unable to locate a C-compiler required by S
c++ - Visual Studio 2012 : Compiler setup (possible to use Compiler from SDK eg. VC++2008-编译器 VC++2010-编译器)
我非常喜欢 Visual Studio 2012，因为 GUI 非常快速和灵活。问题是我需要 VS2010 的 VC++-Compiler。在 VS 2012 中设置旧的编译器、SDK 有什么可能吗？
编译器/语言运行时与中间件
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
"if"语句的代码生成 - 编译器
我正在为类似 C 的语言开发编译器，但在语义分析和代码生成阶段遇到了一些困难。我的问题如下:1) 对于 if 语句，语法如下: if (expression) then statement1; sta
PHP解释器/编译器
我想了解 php 编译器/解释器的工作原理。我试图下载 php 源代码并试图了解它是如何工作的。我找不到合适的文档。如果有人可以阐明制作 php 编译器的模块以及 apache 服务器如何使用 ph
python 编译器
我有一些关于 python 的问题为什么没有 python 编译器来创建本地代码？我找到了 py2exe 等，但它们只是随附了一个 python 解释器，因此，它又是执行代码的解释器。是否无法创建
Java虚拟机JVM性能优化（二）:编译器
本文将是JVM 性能优化系列的第二篇文章(第一篇：传送门)，Java 编译器将是本文讨论的核心内容。本文中，作者（Eva Andreasson）首先介绍了不同种类的编译器，并对客户端编译，服务器
flash - ActionScript 编译器
在 *nix 之类的系统或适当的工具包下是否有任何用于 ActionScript 3 的编译器来处理 Flash？最佳答案 Flex SDK编译器 — mxmlc — 还将编译普通的 ActionS
cmake - 让CMake不检测C++编译器
我正在做一个C项目。但是其他人告诉我，由于没有C++编译器，所以无法构建它。我不知道如何禁用C++的检测。这该怎么做？最佳答案检测C和C++工具链是CMake的默认行为。要禁用此行为，您需要手动
用于数学的 JIT 编译器
我正在寻找可以嵌入到我的程序中的 JIT 编译器或小型编译器库。我打算用它来编译动态生成的执行复数运算的代码。生成的代码在结构上非常简单:没有循环，没有条件，但它们可能很长(由 GCC 编译时只有几
.NET 编译器——调试与发布
多年来，我一直在 VB.NET 中使用 DEBUG 编译器常量将消息写入控制台。我也一直在以类似的方式使用 System.Diagnostics.Debug.Write。我一直认为，当 RELEASE
architecture - 编译器——前端后端
我了解编译器的前端和后端结构。但是，我不确定为什么编译器经常分为前端和后端。我相信有很多原因，你能给我几个吗？因为，大多数书籍/网站会告诉您它们是什么，但无法告诉您原因! 谢谢你。最佳答案前端处理
Javascript 编译器/依赖管理器？
我有很多 JS 文件。其中一些相互依赖。其中许多依赖于 jQuery。我需要一种工具，它可以接受一个文件作为参数，传递地获取其所有依赖项，并以正确的顺序将它们编译成一个文件(基于依赖项) 依赖信息并不
parsing - 编译器，找到语法的第一组
我正在阅读著名的紫龙书第二版，但无法从第 65 页获取有关创建第一组的示例: 我们有以下语法(终端以粗体显示): stmt → expr; | if ( expr ) stmt | for ( opt
C#(仅限语言)编译器
我正在寻找将 C# 语法编译为 native 代码(或者可能编译为 C++？)的选项。我对拥有正式成为该语言一部分的所有库不感兴趣，只是能够像编写 C++ 程序一样编写程序，但使用语言结构，例如部分类
编译器 -march 标志基准测试？
编译器(例如:gcc)中的 -march 标志真的很重要吗？如果我使用 -march=my_architecture 而不是 -march=i686 编译所有程序和内核，会不会更快最佳答案是的，

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - 编译器会做什么