gpt4 book ai didi

c++ - 避免虚函数的标准方法

转载 作者:可可西里 更新时间:2023-11-01 16:40:40 24 4
gpt4 key购买 nike

我有一个库,里面有很多小对象,现在它们都有虚函数。它达到了这样一种程度,即指向虚函数表的指针的大小可以超过对象中有用数据的大小(它通常可以只是一个包含单个 float 的结构) .这些对象是稀疏图上数值模拟中的元素,因此不能轻易合并等。

我不太关心虚函数调用的成本,而是存储成本。正在发生的事情是指向虚函数表的指针基本上降低了缓存的效率。我想知道将类型 ID 存储为整数而不是虚拟函数是否会更好。

我不能使用静态多态性,因为我所有的对象都在一个列表中,我需要能够对项目执行操作,由索引选择(这是一个运行时值 - 因此没有办法静态确定类型)。

问题是:是否存在一种设计模式或通用算法,可以在给定类型列表(例如在类型列表中)和类型索引的情况下从接口(interface)动态调用函数?

接口(interface)已定义并且没有太大变化,但将来(可能技能较低的)库用户将声明新对象,这样做不需要很大的努力。性能是最重要的。可悲的是,没有 C++11。

到目前为止,我可能有一个愚蠢的概念证明:

typedef MakeTypelist(ClassA, ClassB, ClassC) TList; // list of types

enum {
num_types = 3 // number of items in TList
};

std::vector<CommonBase*> uniform_list; // pointers to the objects
std::vector<int> type_id_list; // contains type ids in range [0, num_types)

template <class Op, class L>
class Resolver { // helper class to make a list of functions
typedef typename L::Head T;

// specialized call to op.Op::operator ()<T>(p)
static void Specialize(CommonBase *p, Op op)
{
op(*(T*)p);
}

// add a new item to the list of the functions
static void BuildList(void (**function_list)(CommonBase*, Op))
{
*function_list = &Specialize;
Resolver<Op, typename L::Tail>::BuildList(function_list + 1);
}
};

template <class Op>
class Resolver<Op, TypelistEnd> { // specialization for the end of the list
static void BuildList(void (**function_list)(CommonBase*, Op))
{}
};

/**
* @param[in] i is index of item
* @param[in] op is a STL-style function object with template operator ()
*/
template <class Op>
void Resolve(size_t i, Op op)
{
void (*function_list[num_types])(CommonBase*, Op);
Resolver<Op, TList>::BuildList(function_list);
// fill the list of functions using the typelist

(*function_list[type_id_list[i]])(uniform_list[i], op);
// call the function
}

我还没有研究程序集,但我相信如果将其设为静态,函数指针数组的创建几乎可以免费完成。另一种选择是使用在类型列表上生成的二叉搜索树,这将启用内联。

最佳答案

我最终使用了我在问题中概述的“thunk 表”概念。对于每个操作,有一个 thunk 表的单个实例(它是静态的并通过模板共享 - 因此编译器将自动确保每个操作类型只有一个表实例,而不是每个调用)。因此我的对象没有任何虚函数

最重要的是 - 使用简单的函数指针而不是虚函数所带来的速度增益可以忽略不计(但它也不慢)。实现决策树并静态链接所有函数可显着提高速度 - 这将一些计算强度不是很高的代码的运行时间提高了大约 40%

一个有趣的副作用是能够拥有“虚拟”模板函数,这通常是不可能的。

我需要解决的一个问题是我的所有对象都需要有一些接口(interface),因为它们最终会被仿函数以外的一些调用访问。我为此设计了一个独立的外观。 Facade 是一个虚拟类,声明对象的接口(interface)。分离外观是此虚拟类的实例,专用于给定类(对于列表中的所有类,operator [] 返回所选项目类型的分离外观)。

class CDetachedFacade_Base {
public:
virtual void DoStuff(BaseType *pthis) = 0;
};

template <class ObjectType>
class CDetachedFacade : public CDetachedFacade_Base {
public:
virtual void DoStuff(BaseType *pthis)
{
static_cast<ObjectType>(pthis)->DoStuff();
// statically linked, CObjectType is a final type
}
};

class CMakeFacade {
BaseType *pthis;
CDetachedFacade_Base *pfacade;

public:
CMakeFacade(BaseType *p, CDetachedFacade_Base *f)
:pthis(p), pfacade(f)
{}

inline void DoStuff()
{
f->DoStuff(pthis);
}
};

要使用它,需要做:

static CDetachedFacade<CMyObject> facade;
// this is generated and stored in a templated table
// this needs to be separate to avoid having to call operator new all the time

CMyObject myobj;
myobj.DoStuff(); // statically linked

BaseType *obj = &myobj;
//obj->DoStuff(); // can't do, BaseType does not have virtual functions

CMakeFacade obj_facade(obj, &facade); // choose facade based on type id
obj_facade.DoStuff(); // calls CMyObject::DoStuff()

这允许我在代码的高性能部分使用优化的 thunk 表,并且仍然具有多态行为对象,以便能够在不需要性能的地方方便地处理它们。

关于c++ - 避免虚函数的标准方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23628081/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com