- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
在gcc 4.5.1 (Ubuntu 10.04, intel core2duo 3.0 Ghz)下考虑这段代码这只是 2 个测试,第一个是我直接调用 virtual fucnion,第二个是通过 Wrapper 类调用它:
测试.cpp
#define ITER 100000000
class Print{
public:
typedef Print* Ptr;
virtual void print(int p1, float p2, float p3, float p4){/*DOES NOTHING */}
};
class PrintWrapper
{
public:
typedef PrintWrapper* Ptr;
PrintWrapper(Print::Ptr print, int p1, float p2, float p3, float p4) :
m_print(print), _p1(p1),_p2(p2),_p3(p3),_p4(p4){}
~PrintWrapper(){}
void execute()
{
m_print->print(_p1,_p2,_p3,_p4);
}
private:
Print::Ptr m_print;
int _p1;
float _p2,_p3,_p4;
};
Print::Ptr p = new Print();
PrintWrapper::Ptr pw = new PrintWrapper(p, 1, 2.f,3.0f,4.0f);
void test1()
{
//-------------test 1-------------------------
for (auto var = 0; var < ITER; ++var)
{
p->print(1, 2.f,3.0f,4.0f);
}
}
void test2()
{
//-------------test 2-------------------------
for (auto var = 0; var < ITER; ++var)
{
pw->execute();
}
}
int main()
{
test1();
test2();
}
我用 gprof 和 objdump 分析了它:
g++ -c -std=c++0x -pg -g -O2 test.cpp
objdump -d -M intel -S test.o > objdump.txt
g++ -pg test.o -o test
./test
gprof test > gprof.output
在 gprof.output 中,我观察到 test2() 比 test1() 花费更多时间,但我无法解释它
Each sample counts as 0.01 seconds.
% cumulative self self total
time seconds seconds calls ms/call ms/call name
49.40 0.41 0.41 1 410.00 540.00 test2()
31.33 0.67 0.26 200000000 0.00 0.00 Print::print(int, float, float, float)
19.28 0.83 0.16 1 160.00 290.00 test1()
0.00 0.83 0.00 1 0.00 0.00 global constructors keyed to p
objdump.txt 中的汇编代码对我也没有帮助:
//-------------test 1-------------------------
for (auto var = 0; var < ITER; ++var)
15: 83 c3 01 add ebx,0x1
{
p->print(1, 2.f,3.0f,4.0f);
18: 8b 10 mov edx,DWORD PTR [eax]
1a: c7 44 24 10 00 00 80 mov DWORD PTR [esp+0x10],0x40800000
21: 40
22: c7 44 24 0c 00 00 40 mov DWORD PTR [esp+0xc],0x40400000
29: 40
2a: c7 44 24 08 00 00 00 mov DWORD PTR [esp+0x8],0x40000000
31: 40
32: c7 44 24 04 01 00 00 mov DWORD PTR [esp+0x4],0x1
39: 00
3a: 89 04 24 mov DWORD PTR [esp],eax
3d: ff 12 call DWORD PTR [edx]
//-------------test 2-------------------------
for (auto var = 0; var < ITER; ++var)
65: 83 c3 01 add ebx,0x1
~PrintWrapper(){}
void execute()
{
m_print->print(_p1,_p2,_p3,_p4);
68: 8b 10 mov edx,DWORD PTR [eax]
6a: 8b 70 10 mov esi,DWORD PTR [eax+0x10]
6d: 8b 0a mov ecx,DWORD PTR [edx]
6f: 89 74 24 10 mov DWORD PTR [esp+0x10],esi
73: 8b 70 0c mov esi,DWORD PTR [eax+0xc]
76: 89 74 24 0c mov DWORD PTR [esp+0xc],esi
7a: 8b 70 08 mov esi,DWORD PTR [eax+0x8]
7d: 89 74 24 08 mov DWORD PTR [esp+0x8],esi
81: 8b 40 04 mov eax,DWORD PTR [eax+0x4]
84: 89 14 24 mov DWORD PTR [esp],edx
87: 89 44 24 04 mov DWORD PTR [esp+0x4],eax
8b: ff 11 call DWORD PTR [ecx]
我们如何解释这种差异?
最佳答案
在test2()
中,程序必须首先从堆中加载pw
,然后调用pw->execute()
(这会导致调用开销),然后加载 pw->m_print
以及 _p1
到 _p4
参数,然后加载 pw 的 vtable 指针
,然后为pw->Print
加载vtable槽,然后调用pw->Print
。因为编译器无法看穿虚拟调用,所以它必须假定所有这些值在下一次迭代中都已更改,并重新加载它们。
在test()
中,参数在代码段中内联,我们只需要加载p
、vtable指针和vtable槽。我们以这种方式节省了五次负载。这很容易解释时差。
简而言之 - pw->m_print
和 pw->_p1
到 pw->_p4
的负载是这里的罪魁祸首。
关于C++ : difference of execution time between two call of a virtual function,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8405937/
有时我一直在努力理解为什么在尝试创建航路点任务时任务管理器会收到错误“无法执行执行”。我附上了我正在使用的工作流程,如果您能看一下,我将不胜感激。 1.Initialize FlightControl
我正在 Python 中使用 SQLAlchemy 核心,并且我已多次阅读文档,但仍然需要有关 engine.execute() 的说明。与 connection.execute() . 据我了解,e
在我的 Zend 框架项目中,我想检查是否设置了 cookie。如果是这种情况,我想使用 cookie 内容登录用户。 由于我必须在调用任何 Controller 之前执行此自动登录,因此我尝试将其放
我正在尝试为我创建的 2 个选择语句的 UNION 创建一个 View 。 UNION 在单独执行时工作正常 但问题是当我将它作为 View 执行时,只有 UNION 的第一部分被执行。 我正在使用的
下面我写了一个简单的例子来演示我遇到的问题。执行代码后,我得到一个 cygwin 异常 7200。我环顾四周并尝试了一些事情,但没有解决。有人可以解释为什么我得到它,我该如何解决?感谢您抽出宝贵时间,
从池中获取连接然后在连接上调用 execute 而不是直接在池对象上调用 execute 的用例是什么? 在 Pool 的文档中类,显示此示例: con = await pool.acquire()
我正在尝试通过 SQL 将变量中的 2 个值插入表中,代码完成时没有错误,但条目未显示在表中。 我尝试在即时窗口中执行代码,但这给了我一个关于括号的错误(我真的不知道如何在那里正确输入提示),所以我将
我对广播接收器有点困惑。我有一个广播接收器,它在 TIME_SET 和 TIMEZONE_CHANGED 操作时触发(代码在下面给出)。我想知道的是,当 TIME_SET 和 TIMEZONE_CHA
我必须与需要随每个请求发送访问 token 的外部服务集成。访问 token 的到期时间很短(只有几个小时)。我决定以乐观的方式使用访问 token 。我将使用当前 token 调用外部服务。如果出现
如果我在 swift 中运行以下代码,步骤 1.、2.、3. 和 4. 是否始终按此顺序执行(它们应该如此),或者如果循环存在异步执行的风险,排序等,花费的时间比预期的要长? // 1. fo
我在我的 C++ 应用程序中看到访问冲突错误。在发生违规并使用 !analyze 时将 windbg 附加到进程时,我发现访问违规是由于试图执行不可执行的地址。我知道导致此问题的正在执行的地址。什么可
在使用 Ubuntu 大约一年之后,这对我来说是第一次。 我接手了一个跟踪维修的汽车服务项目。我可以看到每个文件的完整源代码,但是有一个没有扩展名的文件,但在 Ubuntu 中,属性显示为可执行文件(
什么是 LinqPad“自动跟踪执行”和“跳转到执行点”?如何使用它们,如果你能给出一个详细的例子将不胜感激。 最佳答案 这不是一个详细的示例,但它说明了该功能。如果你有一个像 "1".Dump()
我使用 Q.js 来实现 promise 。在下面的代码中,每个方法都会进行 ajax 调用,然后返回一个 Promise。一切都按预期进行,每个方法在下一个方法开始之前执行并完成: function
我有一个类,它实现了 Runnable接口(interface),并且是一个一旦启动就会无限期运行的任务(长时间运行的线程)。 public class LongRunningTask impleme
PDOStatement::execute() [pdostatement.execute]: SQLSTATE[HY093]: 无效的参数数量:绑定(bind)变量的数量与标记数量不匹配 我收到此错
关闭。这个问题是not reproducible or was caused by typos .它目前不接受答案。 这个问题是由于错别字或无法再重现的问题引起的。虽然类似的问题可能是on-topi
想要为执行的每个 linux 命令添加 aspect:executionTime 有什么方法可以添加默认方面环境,以便必须为执行的 linux 命令获取 executionTime 最佳答案 根据 m
我正在尝试安装一个名为 MFOC 的工具.我按照其网站中提到的说明进行操作,如下所示: ebrahim@ubuntu:~$ cd Desktop/mfoc-master/ ebrahim@ubuntu
我刚开始使用 numba 来提高我的程序的性能。我已经减少了我将要呈现的情况 import numba as nb import numpy as np from time import time d
我是一名优秀的程序员,十分优秀!