- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
从网上的一些话我知道 GCC 很聪明,可以决定是否内联一个函数。 inline
关键字只是一个提示:
GCC 可以内联一个普通函数,而不能内联一个内联函数。
但是对于我项目中的这个功能:
struct vb_pos{
union{
struct{
int offset;
int l;
};
unsigned long long g_offset;
};
};
static inline void vi_write_vtail_smart(struct vi *vi){
struct vb_pos *vhead, *vtail, *cursor;
vhead = &vi->v_head;
vtail = &vi->v_tail;
cursor = &vi->cursor;
int curoff = vi->curr - vi->lines[vi->currl].buf;
cursor->offset = curoff;
if(cursor->g_offset >= vhead->g_offset){
*vtail = *cursor;
}
else{
*vtail = *vhead;
*vhead = *cursor;
}
}
使用 -O2 编译。
我检查了汇编代码,知道这个函数是按预期内联的。
然而,当我删除它的inline
修饰符,重新编译时,我发现它不是孤独的内联。它的函数体出现在最终的二进制文件中:
0000000000000000 <vi_write_vtail_smart>:
0: 48 63 47 14 movslq 0x14(%rdi),%rax
4: 48 8b 17 mov (%rdi),%rdx
7: 48 8d 04 40 lea (%rax,%rax,2),%rax
b: 48 8d 04 c2 lea (%rdx,%rax,8),%rax
f: 48 8b 57 18 mov 0x18(%rdi),%rdx
13: 48 2b 10 sub (%rax),%rdx
16: 89 57 10 mov %edx,0x10(%rdi)
19: 48 8b 47 10 mov 0x10(%rdi),%rax
1d: 48 3b 47 38 cmp 0x38(%rdi),%rax
21: 73 0d jae 30 <vi_write_vtail_smart+0x30>
23: 48 8b 57 38 mov 0x38(%rdi),%rdx
27: 48 89 47 38 mov %rax,0x38(%rdi)
2b: 48 89 57 40 mov %rdx,0x40(%rdi)
2f: c3 retq
30: 48 89 47 40 mov %rax,0x40(%rdi)
34: c3 retq
我想知道,既然GCC足够聪明,为什么它没有自己的决定呢?为什么它在我指定时内联执行,而在我不指定时不执行?
因为他没有找到足够的线索来做出强有力的决定?或者,因为他已经有了一个决定,他的决定是:内联与不内联没有太大区别,既然你问我,我就为你内联;否则,我将其保留为通用函数。
我想知道真正的原因。
如果是第一种情况,我想我们可能需要重新考虑一下这篇文章开头的观点(网上很流行)————至少,GCC 没有他们说的那么聪明,inline 关键字并不像他们说的那么无用。
在文末,我想对上面代码片段的上下文添加更多的描述:
1、我本来想把vi_write_vtail_smart()
内联到函数A()
和B()
中,作为库导出API 和两者都将经常被用户调用。
2、A()
和B()
与vi_write_vtail_smart()
在同一个文件中。
3、vi_write_vtail_smart()
只在A()
和B()
中使用,其他地方没有。
4、A()
的函数体大小约为450字节,B()
类似。
5、A()
‖和B()
基本上是纯机器码,没有大循环和繁重的计算,只调用一个子函数,除了vi_write_vtail_smart()
。该子函数在另一个文件中。
6,我做了一个小测试,我在if(cursor->g_offset >= vhead->g_offset){之前加了一行return;
,(我想要看看当这个函数足够小时会发生什么),即:
...
int curoff = vi->curr - vi->lines[vi->currl].buf;
cursor->offset = curoff;
return;
if(cursor->g_offset >= vhead->g_offset){
...
并且在没有inline
修饰符的情况下编译,并检查了汇编代码————这次GCC对其进行了内联,其函数定义从最终的二进制文件中消失了。
7、我的开发环境:
ubuntu-16.04/64位
gcc 版本 5.4.0 20160609
架构:intel X86 Ivybridge Mobile
9,Compile flag(这里又得写一遍,有些人看的时候漏了)-O2 -std=gnu99
最佳答案
根据 GCC 文档,GCC 有一个名为 -finline-functions
的优化设置。这实际上是使 GCC 在所有 函数上使用其启发式内联标准的设置,即使它们未声明为inline
。此设置在 -O3
优化级别启用。因此,如果您想给予 GCC 充分的自由以将其启发式方法应用于所有函数,您必须至少指定 -O3
(或明确指定 -finline-functions
)。
没有 -finline-functions
GCC 通常不会尝试内联未声明为 inline
的函数,但有一些值得注意的异常(exception):许多其他内联选项也可能导致非内联函数被内联。但是,这些选项针对的是非常特殊的情况
-finline-functions-called-once
早在 -O1
就已启用。只调用一次的静态函数是内联的,即使它们没有被声明为inline
。
-finline-small-functions
在 -O2
处启用。如果它导致代码大小减少,它会触发内联,即使函数未声明为 inline
。
您的函数显然没有通过这些在 -O2
级别激活的特定内联过滤器:它相对较大并且(显然)被调用了不止一次。出于这个原因,GCC 不考虑在 -O2
处进行内联,除非您使用 inline
关键字明确请求它。请注意,显式 inline
关键字基本上就像 -finline-functions
设置仅为该特定功能打开。它将使 GCC 考虑将其内联,但不保证内联。
同样,如果您希望 GCC 完全接管这些决策,您需要 -finline-functions
或 -O3
。事实上,显式 inline
关键字在 -O2
处触发内联意味着 GCC 应该决定在 -O3
处内联它,而不管 inline
出现在那里。
关于c++ - 为什么 gcc 不为我决定内联或不内联这个功能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44875934/
#include using namespace std; class C{ private: int value; public: C(){ value = 0;
这个问题已经有答案了: What is the difference between char a[] = ?string?; and char *p = ?string?;? (8 个回答) 已关闭
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 7 年前。 此帖子已于 8 个月
除了调试之外,是否有任何针对 c、c++ 或 c# 的测试工具,其工作原理类似于将独立函数复制粘贴到某个文本框,然后在其他文本框中输入参数? 最佳答案 也许您会考虑单元测试。我推荐你谷歌测试和谷歌模拟
我想在第二台显示器中移动一个窗口 (HWND)。问题是我尝试了很多方法,例如将分辨率加倍或输入负值,但它永远无法将窗口放在我的第二台显示器上。 关于如何在 C/C++/c# 中执行此操作的任何线索 最
我正在寻找 C/C++/C## 中不同类型 DES 的现有实现。我的运行平台是Windows XP/Vista/7。 我正在尝试编写一个 C# 程序,它将使用 DES 算法进行加密和解密。我需要一些实
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
有没有办法强制将另一个 窗口置于顶部? 不是应用程序的窗口,而是另一个已经在系统上运行的窗口。 (Windows, C/C++/C#) 最佳答案 SetWindowPos(that_window_ha
假设您可以在 C/C++ 或 Csharp 之间做出选择,并且您打算在 Windows 和 Linux 服务器上运行同一服务器的多个实例,那么构建套接字服务器应用程序的最明智选择是什么? 最佳答案 如
你们能告诉我它们之间的区别吗? 顺便问一下,有什么叫C++库或C库的吗? 最佳答案 C++ 标准库 和 C 标准库 是 C++ 和 C 标准定义的库,提供给 C++ 和 C 程序使用。那是那些词的共同
下面的测试代码,我将输出信息放在注释中。我使用的是 gcc 4.8.5 和 Centos 7.2。 #include #include class C { public:
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我的客户将使用名为 annoucement 的结构/类与客户通信。我想我会用 C++ 编写服务器。会有很多不同的类继承annoucement。我的问题是通过网络将这些类发送给客户端 我想也许我应该使用
我在 C# 中有以下函数: public Matrix ConcatDescriptors(IList> descriptors) { int cols = descriptors[0].Co
我有一个项目要编写一个函数来对某些数据执行某些操作。我可以用 C/C++ 编写代码,但我不想与雇主共享该函数的代码。相反,我只想让他有权在他自己的代码中调用该函数。是否可以?我想到了这两种方法 - 在
我使用的是编写糟糕的第 3 方 (C/C++) Api。我从托管代码(C++/CLI)中使用它。有时会出现“访问冲突错误”。这使整个应用程序崩溃。我知道我无法处理这些错误[如果指针访问非法内存位置等,
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我有一些 C 代码,将使用 P/Invoke 从 C# 调用。我正在尝试为这个 C 函数定义一个 C# 等效项。 SomeData* DoSomething(); struct SomeData {
这个问题已经有答案了: Why are these constructs using pre and post-increment undefined behavior? (14 个回答) 已关闭 6
我是一名优秀的程序员,十分优秀!