- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我必须通过引用或指针将数组传递给其他函数,我不在乎,只要它运行速度快即可。这就是我开始使用boost库的原因。我是通过以下方式做到的:
using namespace boost;
typedef multi_array<long double, 4> array_type;
typedef multi_array<long double, 2> twod_array_type;
typedef multi_array<long double, 1> vec_type;
作为函数:
void pde_3d_7_stencil_discretization(array_type& A, vec_type& b, vec_type& x,const int& xdim, const int& ydim,const int& zdim)
void gmressolver3d(array_type& A, vec_type& x, vec_type& rhs,const int& KrylovDim,const int& xdim,const int& ydim,const int& zdim,const int& COP, const int& threeDStencil)
在主函数中:
array_type A(extents[threeDimStencil][COP][COP][xdim*ydim*zdim]);
vec_type b(extents[xdim*ydim*zdim*COP]);
vec_type x(extents[xdim*ydim*zdim*COP]);
pde_3d_7_stencil_discretization(A,b,x,xdim,ydim,zdim);
gmressolver3d(A,x,b,KrylovDim,xdim,ydim,zdim,COP,threeDimStencil);
显然,我做错了什么,因为代码的运行速度确实比静态版本慢,静态版本不涉及任何引用/指针,只是将数组从一个函数传递到另一个函数。
我可以做些什么来 boost 这个过程?
感谢您的任何帮助..
编辑:我发布了这些代码的作用,来自 GMRES 求解器的序列:其中的所有数组也使用 Boost 进行了初始化,例如:
vec_type pp(extents[zdim*xdim*ydim*COP]);
vec_type ppp(extents[zdim*xdim*ydim*COP]);
vec_type w(extents[zdim*xdim*ydim*COP]);
vec_type y(extents[KrylovDim]);
vec_type vv(extents[zdim*xdim*ydim*COP]);
vec_type b(extents[KrylovDim+1]);
vec_type ro(extents[zdim*xdim*ydim*COP]);
vec_type out1(extents[xdim*zdim*ydim*COP]);
vec_type m_jac(extents[xdim*zdim*ydim*COP]);
twod_array_type h(extents[KrylovDim+1][KrylovDim]);
twod_array_type v(extents[zdim*xdim*ydim*COP][KrylovDim]);
twod_array_type hess(extents[KrylovDim+1][KrylovDim]);
array_type maa(extents[threeDStencil][COP][COP][zdim*xdim*ydim]);
array_type maaa(extents[threeDStencil][COP][COP][zdim*xdim*ydim]);
for (i=0;i<m+1;i++){
b[i] = 0;
for(k=0;k<m;k++){
h[i][k] = 0.0;
}
}
for (i=0;i<n;i++){
v[i][0] = ro[i]/r;
}
for(j=0;j<m;j++){
b[0] = r;
vector_zero_fill(n,ppp);
for(i=0;i<n;i++){
vv[i]=v[i][j];
}
//********************MATRIX FREE********************
matrix_vector_product_heptadiagonal_discret(A,vv,pp,xdim,ydim,zdim);
//two_vector_dot_product(n,pp,m_jac);
// if(isPrec)
// forback(A,pp);
//********************MATRIX FREE********************
//pretty fast**
for(i=0;i<=j;i++){
for(k=0;k<n;k++){
h[i][j] = h[i][j] + pp[k]*v[k][i];
}
}
for(i=0;i<=j;i++){
for(k=0;k<n;k++){
ppp[k] = ppp[k] + h[i][j]*v[k][i];
}
}
p=0.0;
for(i=0;i<n;i++){
w[i] = pp[i] - ppp[i];
p = p + pow(w[i],2);
}
h[j+1][j] = sqrt(p);
for(i=0;i<=j+1;i++){
for(k=0;k<=j;k++){
hess[i][k] = h[i][k];
}
}
for(i=0;i<j+1;i++){
c = hess[i][i]/sqrt(pow(hess[i][i],2)+pow(hess[i+1][i],2));
s = hess[i+1][i]/sqrt(pow(hess[i][i],2)+pow(hess[i+1][i],2));
for (k=0;k<=j;k++){
inner1=c*hess[i][k]+s*hess[i+1][k];
inner2=(-s)*hess[i][k]+c*hess[i+1][k];
hess[i][k] = inner1;
hess[i+1][k] = inner2;
}
b[i+1] = -s*b[i];
b[i] = c*b[i];
}
最佳答案
在对 multi_aray 进行零初始化的地方,您可以尝试使用 std::memset
代替。例如
std::memset(b.data(), 0, size_of_b_in_bytes);
您的代码中有几个地方多次索引同一个 multi_array
元素。例如,代替
h[i][j] = h[i][j] + pp[k]*v[k][i]
尝试
h[i][j] += pp[k]*v[k][i]
通常,优化器会自动为您进行此类替换,但对于 multi_array
可能不会。
我还发现了两个可以合并为一个的 for 循环,以避免多次索引同一个 multi_array 元素:
/*
for(i=0; i<=j; i++)
{
for(k=0; k<n; k++)
{
h[i][j] = h[i][j] + pp[k]*v[k][i];
}
}
for(i=0; i<=j; i++)
{
for(k=0; k<n; k++)
{
ppp[k] = ppp[k] + h[i][j]*v[k][i];
}
}
*/
for(i=0; i<=j; i++)
{
for(k=0; k<n; k++)
{
long double& h_elem = h[i][j];
long double v_elem = v[k][i];
h_elem += pp[k]*v_elem;
ppp[k] += h_elem*v_elem;
}
}
可能还有更多类似的。请注意使用引用和变量来“记住”一个元素并避免重新计算它在 multi_array 中的位置。
在代码的最后一个 for 循环中,您可以通过使用临时变量和引用来避免多次重新计算 multi_array 索引:
/*
for(i=0;i<j+1;i++){
c = hess[i][i]/sqrt(pow(hess[i][i],2)+pow(hess[i+1][i],2));
s = hess[i+1][i]/sqrt(pow(hess[i][i],2)+pow(hess[i+1][i],2));
for (k=0;k<=j;k++){
inner1=c*hess[i][k]+s*hess[i+1][k];
inner2=(-s)*hess[i][k]+c*hess[i+1][k];
hess[i][k] = inner1;
hess[i+1][k] = inner2;
}
b[i+1] = -s*b[i];
b[i] = c*b[i];
}
*/
for(i=0;i<j+1;i++){
long double hess_i_i = hess[i][i];
long double hess_ip1_i = hess[i+1][i];
long double temp = sqrt(pow(hess_i_i,2)+pow(hess_ip1_i,2));
c = hess_i_i/temp;
s = hess_ip1_i/temp;
for (k=0;k<=j;k++){
long double& hess_i_k = hess[i][k];
long double& hess_ip1_k = hess[i+1][k];
inner1=c*hess_i_k+s*hess_ip1_k;
inner2=(-s)*hess_i_k+c*hess_ip1_k;
hess_i_k = inner1;
hess_ip1_k = inner2;
}
long double b_i& = b[i];
b[i+1] = -s*b_i;
b_i = c*b_i;
}
仔细检查我的工作 - 可以肯定我在某处犯了错误。请注意,我已将 sqrt(pow(hess_i_i,2)+pow(hess_ip1_i,2))
存储在一个变量中,这样它就不会不必要地计算两次。
我怀疑这些微小的调整能否将运行时间缩短至 5 秒。 multi_array
的问题在于数组维度仅在运行时已知。支持行优先/列优先排序可能还会产生一些开销。
使用 C 风格的多维数组,维度在编译时已知,因此编译器可以生成“更紧凑”的代码。
通过使用 Boost multi_arrays,您基本上是在牺牲速度以换取灵 active 和便利性。
关于c++ - Boost::multi_array——引用太慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5283251/
我正在尝试使用boost.spirit的qi库解析某些内容,而我遇到了一个问题。根据spirit docs,a >> b应该产生类型为tuple的东西。但这是boost::tuple(又名 fusio
似乎有/正在努力做到这一点,但到目前为止我看到的大多数资源要么已经过时(带有死链接),要么几乎没有信息来实际构建一个小的工作样本(例如,依赖于boost program_options 以构建可执行文
我对 Boost.Log 的状态有点困惑。这是 Boost 的官方部分,还是尚未被接受?当我用谷歌搜索时,我看到一些帖子谈论它在 2010 年是如何被接受的,等等,但是当我查看最后一个 Boost 库
Boost 提供了两种不同的实现 string_view ,这将成为 C++17 的一部分: boost::string_ref在 utility/string_ref.hpp boost::stri
最近,我被一家GIS公司雇用来重写他们的旧地理信息库。所以我目前正在寻找一个好的计算几何库。我看过CGAL,这真是了不起,但是我的老板想要免费的东西。 所以我现在正在检查Boost.Geometry。
假设我有一个无向图 G。假设我添加以下内容 add_edge(1,2,G); add_edge(1,3,G); add_edge(0,2,G); 现在我再说一遍: add_edge(0,2,G); 我
我使用 CMake 来查找 Boost。找到了 Boost,但 CMake 出错了 Imported targets not available for Boost version 请参阅下面的完整错
我是 boost::fusion 和 boost::mpl 库的新手。谁能告诉我这两个库之间的主要区别? 到目前为止,我只使用 fusion::vector 和其他一些简单的东西。现在我想使用 fus
这个问题已经有答案了: 已关闭10 年前。 Possible Duplicate: What are the benefits of using Boost.Phoenix? 所以我开始阅读 boos
我正在尝试获得一个使用 Boost.Timer 的简单示例,用于一些秒表性能测量,但我不明白为什么我无法成功地将 Boost.Timer 链接到 Boost.Chrono。我使用以下简单脚本从源代码构
我有这样的东西: enum EFood{ eMeat, eFruit }; class Food{ }; class Meat: public Food{ void someM
有人可以告诉我,我如何获得boost::Variant处理无序地图? typedef boost::variant lut_value;unordered_map table; 我认为有一个用于boo
我对 Boost.Geometry 中的环和多边形感到困惑。 在文档中,没有图形显示什么是环,什么是多边形。 谁能画图解释两个概念的区别? 最佳答案 在 Boost.Geometry 中,多边形被定义
我正在使用 boost.pool,但我不知道何时使用 boost::pool<>::malloc和 boost::pool<>::ordered_malloc ? 所以, boost::pool<>:
我正在尝试通过 *boost::fast_pool_allocator* 使用 *boost::container::flat_set*。但是,我收到编译错误。非常感谢您的意见和建议。为了突出这个问题
sau_timer::sau_timer(int secs, timerparam f) : strnd(io), t(io, boost::posix_time::seconds(secs)
我无法理解此功能的文档,我已多次看到以下内容 tie (ei,ei_end) = out_edges(*(vi+a),g); **g**::out_edge_iterator ei, ei_end;
我想在 C++ 中序列化分层数据结构。我正在处理的项目使用 boost,所以我使用 boost::property_tree::ptree 作为我的数据节点结构。 我们有像 Person 这样的高级结
我需要一些帮助来解决这个异常,我正在实现一个 NPAPI 插件,以便能够使用来自浏览器扩展的本地套接字,为此我正在使用 Firebreath 框架。 对于套接字和连接,我使用带有异步调用的 Boost
我尝试将 boost::bind 与 boost::factory 结合使用但没有成功 我有这个类 Zambas 有 4 个参数(2 个字符串和 2 个整数)和 class Zambas { publ
我是一名优秀的程序员,十分优秀!