- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
简而言之,有什么明显的方法可以使 distributor.distribute()
在下面的代码中调用运行得更快吗?
#include <iostream>
#include <memory>
#include <functional>
#include <vector>
#include <typeindex>
#include <unordered_map>
#include <chrono>
// ---------------------------------------------------------------------
// Things to get passed around
// ---------------------------------------------------------------------
class Base {
public:
virtual ~Base() {};
};
class Derived : public Base {};
// ---------------------------------------------------------------------
// Base class for our Handler class so we can store them in a container
// ---------------------------------------------------------------------
class BaseHandler
{
public:
virtual ~BaseHandler() {};
virtual void handle(std::shared_ptr<const Base> ptr) = 0;
};
// ---------------------------------------------------------------------
// Handler class to wrap a std::function. This is helpful because it
// allows us to add metadata to the function call such as call priority
// (not implemented here for simplification)
// ---------------------------------------------------------------------
template <typename T>
class Handler : public BaseHandler
{
public:
Handler(std::function<void(std::shared_ptr<const T>)> handlerFn)
: handlerFn(handlerFn) {};
void handle(std::shared_ptr<const Base> ptr) override {
handlerFn(std::static_pointer_cast<const T>(ptr));
}
private:
std::function<void(std::shared_ptr<const T>)> handlerFn;
};
// ---------------------------------------------------------------------
// Distributor keeps a record of listeners by type and calls them when a
// corresponding object of that type needs to be distributed.
// ---------------------------------------------------------------------
class Distributor
{
public:
template <typename T>
void addHandler(std::shared_ptr<Handler<T>> handler)
{
handlerMap[std::type_index(typeid(T))].emplace_back(handler);
}
void distribute(std::shared_ptr<const Base> basePtr)
{
const Base& base = *basePtr;
std::type_index typeIdx(typeid(base));
for(auto& handler : handlerMap[typeIdx])
{
handler->handle(basePtr);
}
}
private:
std::unordered_map<std::type_index, std::vector<std::shared_ptr<BaseHandler>>> handlerMap;
};
// ---------------------------------------------------------------------
// Benchmarking code
// ---------------------------------------------------------------------
// Test handler function
void handleDerived(std::shared_ptr<const Derived> derived) { }
int main ()
{
size_t iters = 10000000;
size_t numRuns = 10;
Distributor distributor;
// add our test handler
distributor.addHandler(std::make_shared<Handler<Derived>>(&handleDerived));
std::cout << "Raw Func Call\t|\tDistributor\t|\tRatio" << std::endl;
std::cout << "-------------\t|\t-----------\t|\t-----" << std::endl;
for(size_t i = 0; i < numRuns; i++)
{
auto evt = std::make_shared<Derived>();
// time raw function calls
auto start = std::chrono::steady_clock::now();
for (size_t i = 0; i < iters; i++) {
handleDerived(evt);
}
auto d = std::chrono::duration_cast<std::chrono::milliseconds>(std::chrono::steady_clock::now() - start);
// time calls through the distributor
start = std::chrono::steady_clock::now();
for (size_t i = 0; i < iters; i++) {
distributor.distribute(evt);
}
auto d2 = std::chrono::duration_cast<std::chrono::milliseconds>(std::chrono::steady_clock::now() - start);
std::cout << d.count() << "\t\t|\t" << d2.count() << "\t\t|\t" << (d2*1.0/d) << std::endl;
}
}
运行 MinGW-W64 g++ 8.1.0 并使用 -O3
优化的 Windows 10 机器上的结果标志:
Raw Func Call | Distributor | Ratio
------------- | ----------- | -----
256 | 1256 | 4.90625
258 | 1224 | 4.74419
273 | 1222 | 4.47619
246 | 1261 | 5.12602
270 | 1257 | 4.65556
248 | 1276 | 5.14516
272 | 1274 | 4.68382
265 | 1208 | 4.55849
240 | 1224 | 5.1
239 | 1163 | 4.86611
如您所见,分发器调用开销导致大约 4.5-5 倍的减速(与从指向非 const
的指针到指向 const
的指针所需的转换相比)。不过,是否有任何明确的方法可以在保持给定设计模式的同时改进这一点?
应该给处理程序 shared_ptr
因为如果他们愿意,我希望他们能够保留对传递的对象的引用。但他们可能真的想也可能不想保留对它的引用。
我想知道是否有某种方法可以通过避免 shared_ptr
来获得更多性能复制构造,但我不确定最好的方法。
编辑:这个设计有几个方面对我来说非常重要。它们如下:
shared_ptr
必须 是指向非 const
的指针, 和 shared_ptr
处理程序接收到的必须是指向const
的指针.因此,我基本上是在比较 distribute
的成本。反对调用函数的成本,该函数作为引用点发生该转换。Distributor
的用户类应该不需要担心转换。任何转换到Base
然后回到 Derived
类应该对用户不可见。代码的其他方面(如注册监听器)的效率改进也很受欢迎,但不是必需的。最令人担忧的是 Distributor
尽可能高效地调用所有听众。
最佳答案
旁注:
当函数采用 std::shared_ptr
值时,涉及追逐指针(潜在的缓存未命中)和原子增量(相对昂贵的操作)。避免按值获取 std::shared_ptr
。
首先,更改:
void distribute(std::shared_ptr<const Base> basePtr)
到:
void distribute(std::shared_ptr<const Base> const& basePtr)
然后在其他地方。
虽然在较高级别,您将直接调用 handleDerived
的成本与以下调用进行比较:
typeid
调用,这是很大的开销。您可以通过避免那些虚拟调用来减少它:
#include <iostream>
#include <memory>
#include <functional>
#include <vector>
#include <typeindex>
#include <unordered_map>
#include <chrono>
struct Base {
virtual ~Base() {};
};
struct Derived : Base {};
class Distributor
{
public:
template <class T, typename F>
void addHandler(F&& handler) {
handlerMap[std::type_index(typeid(T))].emplace_back(std::forward<F>(handler));
}
void distribute(std::shared_ptr<const Base> const& basePtr) {
std::type_index typeIdx(typeid(*basePtr));
for(auto& handler : handlerMap[typeIdx])
handler(basePtr);
}
private:
std::unordered_map<std::type_index, std::vector<std::function<void(std::shared_ptr<const Base> const&)>>> handlerMap;
};
void handleDerived(std::shared_ptr<const Derived> const&) { }
int main ()
{
size_t iters = 10000000;
size_t numRuns = 10;
Distributor distributor;
// add our test handler
distributor.addHandler<Derived>([](std::shared_ptr<const Base> const& p) {
handleDerived(std::static_pointer_cast<const Derived>(p));
});
std::cout << "Raw Func Call\t|\tDistributor\t|\tRatio" << std::endl;
std::cout << "-------------\t|\t-----------\t|\t-----" << std::endl;
for(size_t i = 0; i < numRuns; i++)
{
auto evt = std::make_shared<Derived>();
// time raw function calls
auto start = std::chrono::steady_clock::now();
for (size_t i = 0; i < iters; i++) {
handleDerived(evt);
}
auto d = std::chrono::duration_cast<std::chrono::milliseconds>(std::chrono::steady_clock::now() - start);
// time calls through the distributor
start = std::chrono::steady_clock::now();
for (size_t i = 0; i < iters; i++) {
distributor.distribute(evt);
}
auto d2 = std::chrono::duration_cast<std::chrono::milliseconds>(std::chrono::steady_clock::now() - start);
std::cout << d.count() << "\t\t|\t" << d2.count() << "\t\t|\t" << (d2*1.0/d) << std::endl;
}
}
输出:
Raw Func Call | Distributor | Ratio
------------- | ----------- | -----
72 | 238 | 3.30556
72 | 238 | 3.30556
72 | 238 | 3.30556
72 | 238 | 3.30556
72 | 238 | 3.30556
72 | 238 | 3.30556
72 | 238 | 3.30556
72 | 238 | 3.30556
72 | 238 | 3.30556
72 | 238 | 3.30556
在我的机器上,初始比率是 4.5。
关于c++ - 如何提高分发到 std::function 监听器的性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50993095/
main.cpp #include "Primes.h" #include int main(){ std::string choose; int num1, num2; w
似乎函数 qwertyInches() 应该可以工作但是当我在 main() 中调用它时它给了我 [Error] called object 'qwertyInches' is not a funct
我无法理解 C++ 语法的工作原理。 #include using namespace std; class Accumulator{ private: int value; public:
在 类中声明 函数成员时,我们可以同时执行这两种操作; Function first; Function() second; 它们之间有什么区别? 最佳答案 Function 代表任意函数: void
“colonna”怎么可能是一个简单的字符串: $('td.' + colonna).css('background-color','#ffddaa'); 可以正确突出显示有趣单元格的背景,并且: $
我正在尝试将网页中的动态参数中继到函数中,然后函数将它们传递给函数内部的调用。比如下面这个简化的代码片段,现在这样,直接传入参数是没有问题的。但是,如何在不为每个可能的 colorbox 参数设置 s
C++ 中是否有一种模式允许您返回一个函数,它返回一个函数本身。例如 std::function func = ...; do { func = func(); } while (func);
我正在将 Windows 程序集移植到 Linux。我有一些代码要移植。我实际上是 linux 中 C 的新手。我知道 C 基础知识是一样的! typedef struct sReader {
我一直在寻找一个很好的解释,所以我很清楚。示例: this.onDeleteHandler(index)}/> 对比 对比 this.nameChangedhandler(event, perso
function(){}.__proto__ === Function.prototype 和 Function.prototype === function(){}.__proto__ 得到不同的结
https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Function 据说 Propert
VBA 中的函数没有特殊类型。我很难理解如何在 Excel VBA 中将函数作为参数添加到函数中。 我想要完成的是这样的事情: function f(g as function, x as strin
所以我正在尝试制作一个包(我没有在下面包含我的 roxygen2 header ): 我有这个功能: date_from_text % dplyr::mutate(!!name := lubr
尝试从 std::function 派生一个类,对于初学者来说,继承构造函数。这是我的猜测: #include #include using namespace std; template cla
我正在尝试编写一个返回另一个函数的函数。我的目标是编写一个函数,它接受一个对象并返回另一个函数“search”。当我使用键调用搜索函数时,我想从第一个函数中给定的对象返回该键的值。 propertyO
我非常清楚函数式编程技术和命令式编程技术之间的区别。但是现在有一种普遍的趋势是谈论“函数式语言”,这确实让我感到困惑。 当然,像 Haskell 这样的一些语言比 C 等其他语言更欢迎函数式编程。但即
关闭。这个问题是opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便 editing this post 可以用事实和引文来回答它。 . 已关闭 8 年前。 Improv
我在stackoverflow上查过很多类似的问题,比如call.call 1 , call.call 2 ,但我是新人,无法发表任何评论。我希望我能找到关于 JavaScript 解释器如何执行这些
向 Twilio 发送 SMS 时,Twilio 会向指定的 URL 发送多个请求,以通过 Webhook 提供该 SMS 传送的状态。我想让这个回调异步,所以我开发了一个 Cloud Functio
作为 IaC 的一部分,A 功能应用 ,让我们将其命名为 FuncAppX 是使用 Terraform 部署的,它有一个内置函数。 我需要使用 Terraform 在函数应用程序中访问相同函数的 Ur
我是一名优秀的程序员,十分优秀!