c++ - 避免运行时多态性的性能问题-6ren

c++ - 避免运行时多态性的性能问题

转载作者：塔克拉玛干更新时间：2023-11-03 02:16:12

26

4

在数以千计的处理器上运行 10 小时的数字代码中，我有一个基类 (Mesh)，其方法被命中数百万次到 100 到 1000 次。目前有两个 (Mesh_A, Mesh_B) 派生类，但最终会扩展到三个或四个。用户代码直到运行时才能知道其指向 Mesh 的指针实际上是 Mesh_A 还是 Mesh_B，但对于运行的其余部分，它永远不会改变。

当前实现:

// Base class
class Mesh {
  ...
  virtual const Point& cell_centroid(int c) = 0;
}

// derived class A
class MeshA : public Mesh {
  ...
  Point& cell_centroid(int c) { return cell_centroids_[c]; }
}

// derived class B
class MeshB : public Mesh {
  ...
  Point& cell_centroid(int c) { return other_framework_->cell_centroid(c); }
}


// typical user class
class User {
  User(Mesh* mesh) : mesh_(mesh) {}

  void evalFunction() {
    for (int c=0; c!=mesh_->num_cells(); ++c) {
      double result = func(mesh_->cell_centroid(c));
      ...
    }
  }


  // Other methods which use mesh_->cell_centroid() very often, and in different ways.
}

之前MeshA是唯一的Mesh，没有基类，重击的方法都是内联的。分析表明，使用虚拟方法对运行时多态性的更改(可能是由于内联的丢失？)导致了约 15% 的命中率，这是行不通的。

我一直在讨论静态多态性和其他想法，但我很想听听关于如何以合理可持续的方式避免这种打击的想法。

想法 1:粗化虚函数以分摊开销。一种想法是尝试将这些方法的所有“调用模式”封装在一个虚拟方法中，将虚拟提升到更粗略的级别，同时将细粒度方法保持为非虚拟。例如，在上面的示例中，可以将函数指针传递给实现循环的 Mesh 的新虚拟方法，返回 double 组并在其中调用非虚拟的内联 cell_centroid() 方法。

// Base class
class Mesh {
  ...
  virtual void evalFunction(double (*func)(Point&), std::vector<double>* result) = 0;
}

// derived class A
class MeshA : public Mesh {
  ...

  void evalFunction(double (*func)(Point&), std::vector<double>* result) {
    for (int c=0; c!=num_cells(); ++c) (*result)[c] = (*func)(cell_centroid(c));
  }

  Point& cell_centroid(int c) { return cell_centroids_[c]; }
}

// similar for B


// typical user class
class User {
  User(Mesh* mesh) : mesh_(mesh) {}

  void evalFunction() {
    m_->evalFunction();
  }
}

我有点担心这会使 Mesh 接口(interface)变得庞大——我没有可以轻松封装的单一访问模式(如示例)。我的猜测是，对于当前 Mesh 类 (15-20) 中的每个虚方法，我会有 3 或 4 种不同的“调用模式”，并且 Mesh 的接口(interface)会爆炸。有多种“用户”类，虽然有时以相同的方式使用 Mesh，但并非总是如此，我不想将自己局限于几种模式。

想法 2: 使用 Mesh_T 模板化所有用户代码.编写一个创建 User<MeshA> 的工厂或 User<MeshB>实例取决于运行时信息。这有点令人担心，因为这实际上意味着我的整个代码都是模板化代码，编译时间会增加，错误会更难调试等等。将触及大型代码库。

想法 3: 在我看来，应该能够在运行开始时解决用户获得的 Mesh 指针实际上是 MeshA 或 MeshB，而不需要执行虚拟表查找并重新获得内联 A 或 B 实现。我不知道这样做的优雅方式基本上不会比想法 1 更糟糕，即 User 中的一堆重复代码与 case/switch。但如果有一种优雅的方式来做到这一点，那将是我的第一选择。

任何关于一个好的选择、更好的想法的想法，或对没有虚拟低级方法的高级类的运行时多态性的其他评论，我们将不胜感激!

最佳答案

前提是我理解正确，mesh_ 将始终是 MeshA 或 MeshB 而不是它们的混合。

//典型的用户类

class User {
  User(Mesh* mesh) : mesh_(mesh) {}

  template<class dType>
  void evalFunction() {
    dType *myMesh = dynamic_cast<dType *>(mesh_);
    for (int c=0; c!=myMesh _->num_cells(); ++c) {
      double result = func(myMesh _->cell_centroid(c));
      ...
    }
  }
  void evalFunction() {
    if (dynamic_cast<MeshA *>(mesh_))
      evalFunction<MeshA>();
    if (dynamic_cast<MeshB *>(mesh_))
      evalFunction<MeshB>();
  }
}

evalFunction 选择 A 或 B 模板。

或者

class User {
  User(Mesh* mesh) : mesh_(mesh) {}

  template<class dType>
  void evalFunction(dType *myMesh) {
    for (int c=0; c!=myMesh _->num_cells(); ++c) {
      double result = func(myMesh _->cell_centroid(c));
      ...
    }
  }
  void evalFunction() {
    MeshA *meshA = dynamic_cast<MeshA *>(mesh_);
    if (meshA)
      evalFunction<MeshA>(meshA);
    MeshB *meshB = dynamic_cast<MeshB *>(mesh_);
    if (meshB)
      evalFunction<MeshB>(meshB);
  }
}

关于c++ - 避免运行时多态性的性能问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34162611/

26

4

0

文章推荐： c++ - 在#include 中获取当前编译单元名称

文章推荐： c++ - 为什么std::lock_guard在使用std::adopt_lock之后释放锁？

文章推荐： arrays - 找出恰好出现 N/2 次的数字

perl - 避免 Mojolicious 异步行为？避免 "AnyEvent::CondVar: recursive blocking wait attempted"
我们已经有一个使用 AnyEvent 的库。它在内部使用 AnyEvent，并最终返回一个值(同步 - 不使用回调)。有什么方法可以将这个库与 Mojolicious 一起使用吗？它的作用如下: #
JAXB 避免 JAXBElement
我想从 XSD 文件生成带有 JAXB 的 Java 类。问题是，我总是得到一些像这样的类(删除了命名空间): public static class Action { @X
javascript - 避免/禁用自动跳转到输入字段
我有一个关于 html 输入标签或 primefaces p:input 的问题。为什么光标总是自动跳转到输入字段。我的页面高度很高，因此您需要向下滚动。输入字段位于页面末尾，光标自动跳转(加载)到页
oop - 避免 if 语句
我今天在考虑面向对象设计，我想知道是否应该避免 if 语句。我的想法是，在任何需要 if 语句的情况下，您都可以简单地创建两个实现相同方法的对象。这两个方法实现只是原始 if 语句的两个可能的分支。
java - 避免 NullPointerException
String graphNameUsed = graphName.getName(); if (graphType.equals("All") || graphType.equals(
mysql - 避免/删除表中的重复行
我有一张友谊 table CREATE TABLE IF NOT EXISTS `friendList` ( `id` int(10) NOT NULL, `id_friend` int(10
c - 避免 if in 循环
上下文 Debian 64。Core 2 二人组。摆弄循环。我使用了同一循环的不同变体，但我希望尽可能避免条件分支。但是，即使我认为它也很难被击败。我考虑过 SSE 或位移位，但它仍然需要跳转(
java - 避免 OutOfMemoryError
我最近在 Java 中创建了一个方法来获取字符串的排列，但是当字符串太长时它会抛出这个错误:java.lang.OutOfMemoryError: Java heap space我确信该方法是有效的，
c++ - 避免 while (!is_eof)
我正在使用 (C++) 库，其中需要使用流初始化对象。库提供的示例代码使用此代码: // Declare the input stream HfstInputStream *in = NULL; tr
MySQL 避免 WHERE/AND 中的子查询重复
我有一个 SQL 查询，我在 WHERE 子句中使用子查询。然后我需要再次使用相同的子查询将其与不同的列进行比较。我假设没有办法在子查询之外访问“emp_education_list li”？我猜
android - 避免 NetworkOnMainThreadException
我了解到在 GUI 线程上不允许进行网络操作。对我来说还可以。但是为什么在 Dialog 按钮点击回调上使用这段代码仍然会产生 NetworkOnMainThreadException ？ new T
C++ 避免 if & 硬编码字符串
有没有办法避免在函数重定向中使用 if 和硬编码字符串，想法是接收一个字符串并调用适当的函数，可能使用模板/元编程.. #include #include void account() {
c - 避免 TIME_WAIT
我正在尝试避免客户端出现 TIME_WAIT。我连接然后设置 O_NONBLOCK 和 SO_REUSEADDR。我调用 read 直到它返回 0。当 read 返回 0 时，errno 也为 0。我
c++ - 避免/检测对导出文件的操纵
我正在开发 C++ Qt 应用程序。为了在应用程序或其连接的设备出现故障时帮助用户，程序导出所有内部设置并将它们存储在一个普通文件(目前为 csv)中。然后将此文件发送到公司(例如通过邮件)。为避免
java - 避免 instanceof
我有一组具有公共(public)父类(super class)的 POJO。这些存储在 superclass 类型的二维数组中。现在，我想从数组中获取一个对象并使用子类的方法。这意味着我必须将它们转
java - 避免 "for"语句中的空指针异常
在我的代码中，当 List 为 null 时，我通常使用这种方法来避免 for 语句中的 NullPointerException: if (myList != null && myList.size
c - 避免 TIME_WAIT
我正在尝试避免客户端出现 TIME_WAIT。我连接然后设置 O_NONBLOCK 和 SO_REUSEADDR。我调用 read 直到它返回 0。当 read 返回 0 时，errno 也为 0。我
c - 避免/减轻每次函数调用后返回值检查的痛苦的方法？
在不支持异常的语言和/或库中，许多/几乎所有函数都会返回一个值，指示其操作成功或失败 - 最著名的例子可能是 UN*X 系统调用，例如 open( ) 或 chdir()，或一些 libc 函数。无
R 按值选择，避免 NA
我尝试按值提取行。 col1 df$col1[col1 == "A"] [1] "A" NA 当然我只想要“A”。如何避免 R 选择 NA 值？顺便说一句，我认为这种行为非常危险，因为很多人都会陷入
R 避免 rowwise() 并寻找更快的替代方案
我想将两个向量合并到一个数据集中，并将其与函数 mutate 集成为 5 个新列到现有数据集中。这是我的示例代码: vector1% rowwise()%>% mutate(vector2|>

首页

博学

6Ren·AI

商城

c++ - 避免运行时多态性的性能问题