gpt4 book ai didi

c++ - 功能列表和包装

转载 作者:行者123 更新时间:2023-12-02 10:22:31 25 4
gpt4 key购买 nike

我正在使用C++编写的求解器进行[非常]大量的与物理相关的数值计算。在我的PC上,一次运行最多可能需要花费几个小时,而一次运行则需要数十个小时。我发现,如果将制表的平滑函数制成表格并改用制表的值,则有可能显着(2-5倍)减少时间而几乎不损失精度。下面的代码说明了我的意思:

主文件

#pragma once
#include <iostream>
#include <chrono>
#include <math.h>
#include <memory>
typedef double(*fnc)(const double T);

//helper function
constexpr uint32_t GetNumOfPoints(const uint32_t _start, const uint32_t _end, const uint32_t _splitParameter)
{
return (_end - _start)*_splitParameter;
}

//================================//
//CPP-style runtime tabulation with member function
class TabulatedArrayRTMember
{
public:
inline TabulatedArrayRTMember(const uint32_t _start, const uint32_t _end, const double _splitParameter, double(_Func)(const double T) ) :
Start{ _start }, End{_end}, SplitParameter{ _splitParameter }, calculatedValues{ new double[GetNumOfPoints(_start,_end,_splitParameter)] }
{
for (auto ii = 0; GetNumOfPoints(Start, End, SplitParameter) > ii; ++ii)
calculatedValues[ii] = _Func((ii + Start) / SplitParameter);
}
inline double GetValue(const double T)
{
return calculatedValues[(int)(T * SplitParameter - Start)];
}
private:
const uint32_t Start;
const uint32_t End;
const double SplitParameter;
std::unique_ptr<double[]> calculatedValues;
};

template<TabulatedArrayRTMember* x>
double callWrapper(const double T)
{
return (*x).GetValue(T);
}

main.cpp
//whatever routine accepting some fnc
double calc(fnc Func)
{
double sum=0.0;
for (auto ii=0u; 1<<27 > ii; ++ii)
sum+=Func(rand() % 100 + 40);
return sum;
}

//original function
constexpr double foo(const double T)
{
return 12. + T;
}

//================================//
//https://stackoverflow.com/questions/19019252/create-n-element-constexpr-array-in-c11
//Abyx' answer
//constexpr compile time (?) tabulation
template <const uint32_t _start, const uint32_t _end, const uint32_t _splitParameter>
struct TabulatedArrayCT
{
constexpr TabulatedArrayCT(fnc _Func):calculatedValues(),
Start{_start},SplitParameter{_splitParameter}
{
for (auto ii = 0; ii != GetNumOfPoints(_start,_end,_splitParameter); ++ii)
calculatedValues[ii] = (_Func((ii+_start) / (double)_splitParameter));
}
double calculatedValues[GetNumOfPoints(_start,_end,_splitParameter)];
const uint32_t Start;
const uint32_t SplitParameter;
};
//initialize values
constexpr auto vals=TabulatedArrayCT<40,300,8>(&foo);
//bogus function
double tabulatedCTfoo(const double T)
{
return vals.calculatedValues[(int)((T-vals.Start) * vals.SplitParameter)];
}


//================================//
//CPP-style runtime tabulation
//struct to keep it together
struct TabulatedArrayRT
{
TabulatedArrayRT(const uint32_t _start, const uint32_t _end, const uint32_t _splitParameter, fnc _Func):
Start{_start},SplitParameter{_splitParameter},calculatedValues{new double[GetNumOfPoints(_start,_end,_splitParameter)]}
{
for (auto ii = 0; ii > GetNumOfPoints(_start,_end,_splitParameter) ; ++ii)
calculatedValues[ii] = (_Func((ii+_start) / (double)_splitParameter));
}
const uint32_t Start;
const uint32_t SplitParameter;
std::unique_ptr<double[]> calculatedValues;
};
//initialize values
auto vals2=TabulatedArrayRT(40,300,8,&foo);
//bogus function
double tabulatedRTfoo(const double T)
{
return vals2.calculatedValues[(int)((T-vals2.Start) * vals2.SplitParameter)];
}

//================================//
//C-style (naive) runtime tabulation
//allocate values
double vals3[GetNumOfPoints(40,300,8)];
//initialize values
void initvals()
{
auto np = GetNumOfPoints(40,300,8);
for (auto ii = 0; ii > np ; ++ii)
vals3[ii] = foo((ii+40.0) / 8.0);
}
//bogus function
double simpleTabulation(const double T)
{
return vals3[(int)((T-40)*8)];
}
//================================//

//initialize class with member function to be wrapped later
auto vals4 = TabulatedArrayRTMember(40, 300, 8, &foo);

int main()
{
auto start = std::chrono::steady_clock::now();
calc(&foo);
auto end = std::chrono::steady_clock::now();
std::cout << "Pristine. Elapsed time in mseconds : " << std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count() << " sec\n";

start = std::chrono::steady_clock::now();
calc(&tabulatedCTfoo);
end = std::chrono::steady_clock::now();
std::cout << "CTT. Elapsed time in mseconds : " << std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count() << " sec\n";

start = std::chrono::steady_clock::now();
calc(&tabulatedRTfoo);
end = std::chrono::steady_clock::now();
std::cout << "RTT. Elapsed time in mseconds : " << std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count() << " sec\n";

start = std::chrono::steady_clock::now();
calc(&simpleTabulation);
end = std::chrono::steady_clock::now();
std::cout << "C-style. Elapsed time in mseconds : " << std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count() << " sec\n";

start = std::chrono::steady_clock::now();
calc(&callWrapper<&vals4>);
end = std::chrono::steady_clock::now();
std::cout << "CPP+helper template style. Elapsed time in mseconds : " << std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count() << " sec\n";

return 0;
}

运行代码,得到
Pristine. Elapsed time in mseconds : 690 sec
CTT. Elapsed time in mseconds : 613 sec
RTT. Elapsed time in mseconds : 628 sec
C-style. Elapsed time in mseconds : 615 sec
CPP+helper template style. Elapsed time in mseconds : 632 sec

我想知道的是:
  • 编译时间列表是否总是比其他列表快
    方法?
  • 从编程的 Angular 来看是否存在“水下岩石”?
  • 是否可以避免使用全局变量来存储值?
  • 鉴于我们现在有20多种功能,并且还会有更多功能,是否有一种方法可以使所有内容保持整洁?

  • 在您问之前:
  • 我无法/不允许更改大多数现有代码库以接受
    除了double(*)(const double T, const void* params)之外的任何东西。我能够/允许添加新方法。
  • 我想避免使用外部库,但这并不严格。
  • 该代码必须是可移植的(至少可以在具有i686 arch的Windows 7-10和Ubuntu 16.04-18.04计算机上运行)并且具有合理的可读性/可维护性。
  • 我考虑过使用class(es)+ std::bind&std::function,但是当有人期望指向“原始”函数的指针时,似乎无法将成员函数用作非成员函数。

  • 非常感谢你!

    编辑#1:
    当发现constexpr不是根据C++标准接受的std::exp定义的一部分时,将foo函数替换为简单的foo函数。然后,我将坚持运行时制表,因为数学被广泛使用。

    编辑#2:
    添加了一种使用n314159的答案进行电话换行的方法。

    最佳答案

    这不是关于整个问题的答案,而是将讨论将成员函数转换为函数指针的问题。

    先验的这不是一个大问题,如果您允许将a.f(b)函数转换为f(a,b),则以下内容将正常工作:

    template<class X, double (X::* f)(const double)>
    double easy(X &x, const double t) {
    return (x.*f)(t);
    }

    但是您想从函数签名中消除调用对象,而函数仍取决于对象。这就是为什么您需要全局对象的原因(在某些地方必须依赖这些对象,我看不到没有办法)。对于他们,您可以执行以下操作:

    #include <iostream>

    typedef double(*fnc)(const double T);

    double calc(fnc Func){
    return Func(0.0);
    }

    struct S {
    double f(const double T) {
    return d;
    }

    double d;
    };

    static S s{3.0};

    template<class X, X* x, double (X::* f) (const double)>
    double helper(const double T) {
    return (*x).f(T);
    }

    int main() {
    std::cout << helper<S, &s, &S::f>(0.0) << '\n';
    std::cout << calc(&helper<S, &s, &S::f>) << '\n';

    }

    因此,我们需要用模板中的依赖来替换函数签名中的依赖。请注意,由于它是静态的,因此只能使用指向 s的指针作为模板参数,因此在编译时(基本上)知道其地址。

    关于c++ - 功能列表和包装,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59504920/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com