c++ - 全局时间成本与本地时间成本总和—

c++ - 全局时间成本与本地时间成本总和—— "for"循环

转载作者：行者123 更新时间：2023-11-28 04:06:58

25

4

虽然看起来很愚蠢，但我想知道在尝试协调 for 循环的时间成本时是否存在陷阱，如测量的那样

从 for 循环之外的时间点开始(全局或外部时间成本)
或者，从循环内的时间点开始，并被累积考虑(本地或内部时间成本)？

下面的例子说明了我在获得两个相等的测量值时遇到的困难:

#include <iostream>
#include <vector> // std::vector
#include <ctime> // clock(), ..

int main(){
  clock_t clockStartLoop;
  double timeInternal(0)// the time cost of the loop, summing all time costs of commands within the "for" loop
    , timeExternal // time cost of the loop, as measured outside the boundaries of "for" loop
    ;
  std::vector<int> vecInt; // will be [0,1,..,10000] after the loop below
  clock_t costExternal(clock());
  for(int i=0;i<10000;i++){
    clockStartLoop = clock();
    vecInt.push_back(i);
    timeInternal += clock() - clockStartLoop; // incrementing internal time cost
  }
  timeInternal /= CLOCKS_PER_SEC;
  timeExternal = (clock() - costExternal)/(double)CLOCKS_PER_SEC;

  std::cout << "timeExternal = "<< timeExternal << " s ";
  std::cout << "vs timeInternal = " << timeInternal << std::endl;
  std::cout << "We have a ratio of " << timeExternal/timeInternal << " between the two.." << std::endl;
}

我通常会得到大约 2 的比率作为输出，例如

timeExternal = 0.008407 s vs timeInternal = 0.004287 We have a ratio of 1.96105 between the two..

，而我希望比率接近 1。

是否只是因为循环中存在内部操作，这些操作不是由 clock() 差异测量的(例如递增 timeInternal)？
能否在for(..)中的i++操作在外部测量中是不可忽略的，并能解释与内部测量的区别？

我实际上正在处理一个更复杂的代码，我想将时间成本隔离在一个循环中，确保我考虑的所有时间片确实构成了一个完整的饼图(直到现在我才实现......) .非常感谢

最佳答案

timeExternal = 0.008407 s vs timeInternal = 0.004287 We have a ratio of 1.96105 between the two..

比率约为 2 是可以预期的 - 到目前为止，循环中最重的调用是 clock() 本身(在大多数系统上 clock() 是一个系统调用到内核)。

假设 clock() 实现类似于以下伪代码:

clock_t clock() {
    go_to_kernel(); // very long operation
    clock_t rc = query_process_clock();
    return_from_kernel(); // very long operation
    return rc;
}

现在回到循环，我们可以注释时间花费的地方:

  for(int i=0;i<10000;i++){
    // go_to_kernel - very long operation
    clockStartLoop = clock();
    // return_from_kernel - very long operation
    vecInt.push_back(i);
    // go_to_kernel - very long operation
    timeInternal += clock() - clockStartLoop;
    // return_from_kernel - very long operation
  }

所以在对 clock() 的两次调用之间，我们有 2 个长操作，循环中的总数为 4。因此比率为 2 比 1。

Is it just because there are operations internal to the loop which are not measured by the clock() difference (such as incrementing timeInternal) ?

不，递增 timeInterval 可以忽略不计。

Could the i++ operation in the for(..) be non-negligible in the external measurement and also explain the difference with the internal one ?

不，i++ 也可以忽略不计。移除对 clock() 的内部调用，您将看到更快的执行时间。在我的系统上它是 0.00003 秒。

在 clock() 之后下一个最昂贵的操作是 vector::push_back()，因为它需要调整 vector 的大小。这是由二次增长因子摊销的，可以通过在进入循环之前调用 vector::reserve() 完全消除。

结论:进行基准测试时，请确保为整个循环计时，而不是为单个迭代计时。更好的是，使用像 Google Benchmark 这样的框架，这将有助于避免许多其他陷阱(如编译器优化)。还有 quick-bench.com适用于简单情况(基于 Google Benchmark)。

关于c++ - 全局时间成本与本地时间成本总和—— "for"循环，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58560580/

25

4

0

文章推荐： c++ - 我想仅使用递归将字符 "a"替换为字符 "z"

文章推荐： C++ - 更改另一个文件的 ASM 指令

文章推荐： c++ - 强制 Visual Studio 进入 STL 类/函数

文章推荐： c++ - 如何解决C6386警告？

MySQL 总和 + 总和
我基本上有三个表: hunt_c_usershunt_c_collected_eggshunt_c_achievements 我目前只使用 hunt_c_users 和 hunt_c_collecte
SQL 总和
我已经计算了不同表中计数的总和。这会执行两次，每个 performanceID 一次。现在我想得到两个总和的总和。下面是我目前做的两个总和的代码: SELECT SUM((COUNT (Bo
Jquery 总和
我有一个对 2 个值求和的脚本。我计划添加更多值(value)，但首先我需要让它发挥作用。人们告诉我给他们 NUMBER 值，所以我这样做了，但现在它甚至没有给出输出。 base = 0; $("#F
MongoDB - 总和
我正在尝试计算在我们的数据库中跟踪的花费总额。每个订单文档包含一个字段“total_price” 我正在尝试使用以下代码: db.orders.aggregate({ $group: {
基于在另一个表中查找代码和值的 Excel 总和
给定 Excel 2013(或更高版本)中的 2 个命名表: tbl发票 ID InvRef Total 1 I/123 45 2 I/234
特殊表格之间的 VBA 总和
希望你们一切都好。我来这里是因为我从今天早上开始就试图解决一个问题，我再也受不了了。这就是上下文:我有一个 excel 工作簿，其中有不同的工作表，其中包含不同国家/地区的不同商业计划。我的目标是制
sql - 在查询结果中插入行(总和)
我有一份报告显示客户订购的产品及其价格: CompanyA Product 7 14.99 CompanyA Product 3 45.95 CompanyA Prod
python - Redis时间序列-总和
我使用此python客户端: https://github.com/ryananguiano/python-redis-timeseries 如何汇总所有匹配？ ts = TimeSeries(cli
excel - 总和/计数公式自动调整插入的行
希望创建一个总和和计数公式，该公式将自动调整以适应范围内插入的新行。例如，如果我在单元格 D55 中有公式 =SUM(D17:D54)。每次我在该范围内插入新行时，我都需要更改公式的顶部范围来解释它
python - 聚合具有相同日期的列(总和)
所以，我需要聚合日期相同的行。到目前为止，我的代码返回以下内容: date value source 0 2018-04-08 15:52:26.1
javascript - 将表中的数值相加(总和)
我有数字输入数量约为 30 我需要将它们全部汇总到一个字段我拥有的在下面查看:
具有特定数量条目的列的 MYSQL 总和
您好，我正在尝试根据以下数据计算过去三个月中出现不止一次的不同帐户 ID 的数量；我想要 2 作为查询结果，因为 test1@gmail.com 和 test2@gmail.com 出现超过 1 次。
php - 如何从一个表中选择与另一表中的差异(总和)？
我有两个带有以下字段的表: ... orders.orderID orders.orderValue 和 payments.orderID payments.payVal 在 payments.pay
来自别名未知列的 MySQL 总和
我想按 image_gallery 和 video_gallery 两列的 DESC 进行排序。 SELECT b.*, c.title as category, (S
mysql - 如何从别名查找mysql中的总计(总和)？
实际上我的原始数据库为 SELECT sum(data1,data2) as database_value,sum(data3,data4) as database_not_value from t
javascript - JavaScript 总和
我试图获取三个分数中每一个的值并将它们相加并显示在“总计:”中。我的问题是，我不知道如何做到这一点，以便每次其中一个分数值发生变化时，相应的总分值也会随之变化。我可以在某处调用“onchange”来
按第一个分组的元组列表中元组的第二个和第三个元素的 Python 总和
如何获得按第一个值分组的元组列表中第二个和第三个值的总和？即: list_of_tuples = [(1, 3, 1), (1, 2, 4), (2, 1, 0), (2, 2, 0)] expec
python - 总和、平均和其他
我正在尝试将我的列表中的整数转换为列表的总和和平均值，并说明任何低于冰点 F<32 的温度。每当我尝试获取总和或平均值时，我都会收到错误提示“+: 'int' 和 'str' 不支持的操作数类型”。我
ios - NSDecimalNumber 总和
在我的 ios 项目中，我使用了两个实体 (CoreData):具有一对多关系的 Person 和 Gifts 我知道如何计算给一个人的礼物总和: NSDecimalNumber *orderSum=
SQLITE:显示每个类别的总计(总和)
我有两个表(输入和类别): CREATE TABLE categories ( iId INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT, sNam

首页

博学

6Ren·AI

商城

c++ - 全局时间成本与本地时间成本总和—— "for"循环