c++ - 发布版本中成员函数和全局函数的性能差异-6ren

c++ - 发布版本中成员函数和全局函数的性能差异

转载作者：塔克拉玛干更新时间：2023-11-03 01:44:10

24

4

我实现了两个函数来执行两个Vector(不是std::vector)的叉积，一个是成员函数，另一个是全局函数，这里是关键代码(其他部分省略)

//for member function
template <typename Scalar>
SquareMatrix<Scalar,3> Vector<Scalar,3>::outerProduct(const Vector<Scalar,3> &vec3) const
{
    SquareMatrix<Scalar,3> result;
    for(unsigned int i = 0; i < 3; ++i)
        for(unsigned int j = 0; j < 3; ++j)
            result(i,j) = (*this)[i]*vec3[j];
    return result;
}

//for global function: Dim = 3
template<typename Scalar, int Dim>
void outerProduct(const Vector<Scalar, Dim> & v1 , const Vector<Scalar, Dim> & v2, SquareMatrix<Scalar, Dim> & m)
{
    for (unsigned int i=0; i<Dim; i++)
        for (unsigned int j=0; j<Dim; j++)
        {
            m(i,j) = v1[i]*v2[j];
        }
}

它们几乎相同，只是一个是有返回值的成员函数，另一个是全局函数，其中计算的值直接赋给一个方阵，因此不需要返回值。
实际上，我的意思是用全局成员替换成员成员以提高性能，因为第一个涉及复制操作。然而，奇怪的是，全局函数的时间成本几乎是成员函数的两倍。此外，我发现执行

m(i,j) = v1[i]*v2[j]; // in global function

比

需要更多的时间

result(i,j) = (*this)[i]*vec3[j]; // in member function

那么问题来了，成员函数和全局函数的这种性能差异是如何产生的呢？

谁能说说原因？
希望我已经清楚地提出了我的问题，对不起我糟糕的英语!

//-------------------------------------------- ------------------------------------------
更多信息补充:
以下是我用来测试性能的代码:

    //the codes below is in a loop
    Vector<double, 3> vec1;
    Vector<double, 3> vec2;
    Timer timer;
    timer.startTimer();
    for (unsigned int i=0; i<100000; i++)
    {
        SquareMatrix<double,3> m = vec1.outerProduct(vec2);
    }
    timer.stopTimer();
    std::cout<<"time cost for member function: "<< timer.getElapsedTime()<<std::endl;

    timer.startTimer();
    SquareMatrix<double,3> m;
    for (unsigned int i=0; i<100000; i++)
    {
        outerProduct(vec1, vec2, m);
    }
    timer.stopTimer();
    std::cout<<"time cost for global function: "<< timer.getElapsedTime()<<std::endl;
    std::system("pause");

和捕获的结果:
enter image description here

你可以看到成员函数比全局函数快了将近两倍。

另外，我的项目是基于64位windows系统构建的，代码实际上是基于Scons构建工具生成静态lib文件，以及生成的vs2010项目文件。

我要提醒的是，这种奇怪的性能差异只出现在发布版本中，而在调试构建类型中，全局函数几乎比成员函数快五倍。(大约 0.10s vs 0.02s)

最佳答案

一种可能的解释:

对于内联，在第一种情况下，编译器可能知道 result(i, j) (来自局部变量)不使用别名 this[i]或 vec3[j] ，所以 this 的标量数组都不是也不vec3被修改。

第二种情况，从函数的角度来看，变量可能存在别名，所以分别写入m可能会修改 v1 的标量或 v2 , 所以 v1[i] 都不是也不v2[j]可以缓存。

你可以试试 restrict关键字扩展来检查我的假设是否正确。

关于c++ - 发布版本中成员函数和全局函数的性能差异，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30422729/

24

4

0

文章推荐： c++ - 装饰者模式在这里是合适的选择吗？

文章推荐： linux - Grep 到给定的文件名

文章推荐： c - 在 C 中使用 free() 时出错

文章推荐： linux - 在 vim 中将垂直文本转换为水平文本

Javascript:私有(private)成员(使用闭包)，为什么初始化后添加的函数不能访问私有(private)成员？
test = (function(){var key = 200; return {getKey : function(){return key} }; })(); test.
java - 如果公共(public)成员访问私有(private)成员，则不继承私有(private)成员
如果这个问题可能一直被问到，我很抱歉，但我进行了搜索，但找不到足够的答案。如果公共(public)成员/方法正在访问私有(private)成员/字段，如何禁用它们的继承？所以考虑一下: publi
c++ - memcpy/memmove 到 union 成员，这是否设置了 'active' 成员？
重要的澄清:一些评论者似乎认为我是从 union 复制的。仔细查看 memcpy，它从一个普通的旧 uint32_t 地址复制而来，该地址不包含在 union 中。另外，我正在(通过 memcpy)复
android - Spinner Android Value 成员(member)和 Display 成员(member)
spinner 通常只显示一个字符串，在我想分配 IDpersonne 和 Name 的情况下，旋转器必须告诉我名字。当我得到选定的项目时，我必须得到 ID。我该怎么做？最佳答案我假设您已将项目排
java - A 类的实例是 B 类的公共(public)成员，B 的实例也是 A 的公共(public)成员。我们什么时候需要这个实现？
A 类的实例是 B 类的公共(public)成员。B 类的实例也是 A 的公共(public)成员。在什么情况下可能需要这种实现？我的意思是是否有一个或多个标准场景需要这种实现方式？更具体的细节:我有
成员(member)提供者
我如何设置我的 web.config 以使用表单例份验证，将成员身份提供程序设置为 ActiveDirectoryMembershipProvider 并使用内置登录控件。这样我就可以使用有效的事件目
Java接口(interface)成员
这个问题已经有答案了: Should methods in a Java interface be declared with or without a public access modifier?
php反序列化与私有(private)成员
因此根据定义，类中的私有(private)数字在序列化时以类名作为前缀。这对我来说是一个问题，我希望能够序列化/保存/反序列化一个确切的对象，但是 php 所做的是给我另一个 classname+va
recursion - 成员？在无限列表上运行
我实现了一个成员？ clojure 中的函数如下: (defn member? [item seq] (cond (empty? seq) false (= item (first
C - 按值传递结构+成员
我在这里的问题似乎总是与使用函数有关。它仍然让我困惑!在本教科书练习中，我被要求按值传递结构，然后调整它并按引用传递。最初我设计的代码是在 main 中完成所有工作。现在我正在传递值。所以我添加了新函
无法使用实例引用访问 C# 成员
所以我有这些变量 List files, images = new List(); string rootStr; 还有这个线程函数 private static int[] thread_searc
c++ - 为什么我需要重新声明部分模板特化的方法/成员？
我对 C++ 模板和尝试弄清楚部分模板特化还比较陌生。我正在使用模板实现几个相关的数据结构:用于概率存在/不存在查询的布隆过滤器(基于位数组)，以及用于丰度查询的计数布隆过滤器(带有整数数组)。我从以
java - 在内部类安全实践中访问外部类变量/成员？
例如在 java 中，我在外部类和内部类中声明并初始化了一个 JButton，我决定在某些情况下将其隐藏，这是一种安全的编程实践吗？最佳答案内部类的全部目的是它们可以访问到环绕内部类的外部类。所
c++ - 我应该如何构造相互依赖的C++成员？
我有一个使用库进行通信的类: class Topic { Topic( Type T, String name ); }; class Reader { Reader (Topic, Stri
Java使用父类型的对象引用访问不同包中子类中的 protected 成员
我在两个单独的文件中有以下代码。 package animal; public class Frog { protected void ribbit() { Syste
redis - 从具有非连续分数的排序集中检索值/成员
我有一个分数列表。使用这些，我需要从 redis 排序集中提取值。我知道我可以使用 zrangebyscore - 但如果我提供的列表中的分数不连续怎么办？在这种情况下，我不能依赖 zrangeby
c++ - 尝试使用静态方法/成员
过去几年我一直被 C# 编码宠坏了，现在我又回到了 C++ 并发现我在处理本应很简单的东西时遇到了麻烦。我正在为 gamedev 使用名为 DarkGDK 的第三方库(任何以 db 为前缀的命令)，但
scheme - 成员？ Racket 中的功能
我正在关注 Brian Harvey 从 2011 年开始在 UC Berkeley site 上的 SICP 讲座。 .他正在使用 STk interpreter教这门课，我正在使用带有 DrRac
c++ - 无法访问模板化重载运算符中的私有(private)成员
在这段代码中，为什么在运算符重载中无法访问我的类的私有(private)字段？ (请注意，这只是一个 MRE，不是完整代码) template class Frac template Frac o
c++ - 全局命名空间好友类无法访问命名命名空间类的私有(private)成员
在命名命名空间类中，我将一个类(位于全局命名空间中)声明为友元。但是，后一个类不能访问前一个类的私有(private)成员。为什么是这样？有什么办法可以解决吗？ Bob.h namespace AB

首页

博学

6Ren·AI

商城

c++ - 发布版本中成员函数和全局函数的性能差异