- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想知道是否有一种更简洁(或更好、更有效)的方法来对 vector/(非对称)矩阵的值求和(具有类似对称结构的矩阵,当然可以在循环中利用,但不是那样与我的问题相关)由一组索引指出。基本上,此代码可用于计算通过二维矩阵的路线成本。我正在寻找一种利用 CPU 而不是 GPU 的方法。
下面是一些相关的代码,我比较感兴趣的是第一种情况。我在想可以将 std::accumulate
与 lambda 一起使用来捕获索引 vector ,但后来我想知道,是否已经有更简洁的方法,也许与其他运算符一起使用。这不是一个“真正的问题”,因为循环对我的口味来说也很清楚,但在寻找 super 整洁或更高效的在线程序时......
template<typename out_type>
out_type sum(std::vector<float> const& matrix, std::vector<int> const& indices)
{
out_type cost = 0;
for(decltype(indices.size()) i = 0; i < indices.size() - 1; ++i)
{
const int index = indices.size() * indices[i] + indices[i + 1];
cost += matrix[index];
}
const int index = indices.size() * indices[indices.size() - 1] + indices[0];
cost += matrix[index];
return cost;
}
template<typename out_type>
out_type sum(std::vector<std::vector<float>> const& matrix, std::vector<int> const& indices)
{
out_type cost = 0;
for(decltype(indices.size()) i = 0; i < indices.size() - 1; i++)
{
cost += matrix[indices[i]][indices[i + 1]];
}
cost += matrix[indices[indices.size() - 1]][indices[0]];
return cost;
}
作为事后的想法和对约翰的评论,是否有一个地方可以雇用 std::common_type在计算中输入和输出类型可能不同?这有点挥手,更像是学习技术和图书馆。 code kata 的一种形式,如果你愿意的话。
现在,有一种方法可以使循环更快,在博客文章中有解释 How to process a STL vector using SSE code由博主 theowl84 撰写。代码中直接使用了__m128
,但是不知DirectXMath里面有没有图书馆也是。
现在,在编写了一些具体代码之后,我发现 std::accumulate
不会让我走得太远。或者至少我找不到方法来完成 matrix[indices[i]][indices[i + 1]] 中的
以一种简洁的方式,因为 [indices[i + 1]
部分;std::accumulate
本身只允许访问当前值和总和。从这个角度来看,novelocrat 的方法似乎是最有成效的方法。
DeadMG建议使用 parallel_reduce带有关联性警告,novelocrat 进一步评论.我没有去看看我是否可以使用 parallel_reduce ,因为界面看起来有些笨重,无法快速尝试。除此之外,即使我的代码是串行执行的,它也会遇到与并行缩减版本相同的 float 问题。我认为,虽然并行版本会/可能比串行版本更不可预测。
这有点离题,但这里的一些绊脚石可能会感兴趣,而那些读到这里的人可能会对文章 Wandering Precision 感兴趣(非常)在 NAG blog ,其中详细介绍了一些甚至由硬件指令重新排序引入的复杂问题!然后在#AltDevBlogADay Synchronous RTS Engines and a Tale of Desyncs 中对分布式设置中的这个问题进行了一些反射(reflection)。 .另外,ACCU (顺便说一下,一般邮件列表非常好,而且可以免费加入)有几篇关于浮点精度的文章(例如 this)。相切相切,我找到了 Fernando Cacciola 的 Robustness issues in geometric computing成为一篇值得阅读的好文章,最初来自 ACCU 邮件列表。
然后是 std::common_type
。我找不到它的用法。如果我有两种不同的类型作为参数,那么返回值可以/应该由 std::common_type
决定。也许更相关的是 std::is_convertible
和 static_assert
以确保所需的结果类型可以从参数类型转换(带有干净的错误消息)。除此之外,我只能检查返回值/中间计算值的准确性是否足以表示求和结果而不会溢出之类的,但我还没有遇到过标准的工具。
女士们,先生们,我想就是这样。我玩得很开心,我希望阅读本文的人也能从中有所收获。
最佳答案
您可以生成一个采用矩阵
和索引
并产生适当值的迭代器。
class route_iterator
{
vector<vector<float>> const& matrix;
vector<int> const& indices;
int i;
public:
route_iterator(vector<vector<float>> const& matrix_, vector<int> const& indices_,
int begin = 0)
: matrix(matrix_), indices(indices_), i(begin)
{ }
float operator*() {
return matrix[indices[i]][indices[(i + 1) % indices.size()]];
}
route_iterator& operator++() {
++i;
return *this;
}
};
然后你的累积运行从 route_iterator(matrix, indices)
到 route_iterator(matrix, indices, indices.size())
。
不过,不可否认,这在没有智能编译器将其转换为并行的情况下进行顺序化。您真正想要的是并行映射和折叠(累积)操作。
关于c++ - 如何使用 std::accumulate 对单独定义的索引指向的 vector 中的值进行巧妙的求和(替换循环),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12334389/
我只是在阅读有关 HQ9+ 编程语言的一些内容: https://esolangs.org/wiki/HQ9+ , https://en.wikipedia.org/wiki/HQ9+ , 和 htt
首先,我是 Mongo DB 的新手。一直在遵循一些指南和示例,例如 https://www.programcreek.com/java-api-examples/index.php?api=com.
当我写作时 long long sum = accumulate(a.begin(), a.end(), 0); 或者 long long sum = accumulate(a.begin(), a.
当我写作时 long long sum = accumulate(a.begin(), a.end(), 0); 或者 long long sum = accumulate(a.begin(), a.
我有一个关于 accumulate() 和运算符重载的问题。 我有一个类 Order 包含 private: Customer cust; std::vector vP; 和一个类 Purchase
我在 C++ 中使用 opencv 库,我正在尝试计算 vector difference 中包含的点的总和 Point 类具有 x 属性,即 float . float pointSumX(Poin
我试图将以下循环转换为 accumulate() 调用,但我失败了: total = 0 for h in heat_values: total += h total -= total
如果我像下面这样在 C++ 中使用 accumulate 函数 std::vector v2{1, 2, 3, 4, 5}; int sum = 0; std::cout values{ 1,
有没有办法按名称获取已注册的 Spark 累加器,而无需传递实际引用?期望的行为: val cnt1 = sc.longAccumulator("cnt1") val cnt2 = something
std::accumulate 的 C++ 引用没有提到 std::accumulate 可能抛出的任何异常,仍然它的定义不包含 noexcept。假设一个人使用不抛出的类型和操作,在声明为 noex
尝试“滥用”std::accumulate 算法(为什么它出现在“数字” header 中?;)) template std::string strjoin(Range&& range, Sepera
这让我很困惑,如果有人能帮助我,我将不胜感激。 (编辑:以为这是一个模板化问题,我误会了) 我想使用 gnu 的并行累积算法(存储在 #include 中)添加以下类的多个拷贝 类故意不做太多,我觉
错误似乎与 std::accumulate() 或迭代器有关,或者我是否访问了无效指针? int m = 0; std::vector v{4,-3,0,-5}; for(std::vector::i
此代码是从另一个用户问题复制而来的,我很好奇这里的 accumulate 是如何工作的。我从这段代码中得到了正确的结果,但想知道 lcm 在“累积”时采用什么参数。初始化为 A,范围之和为 b?请帮忙
如何统计满足 lower_bound(42), upper_bound(137) 的元素数量从这段代码?? accumulate(values.lower_bound(42), values.uppe
我在测试代码中使用 std::accumulate 得到了意想不到的结果。我正在尝试添加一个大的 double vector ,但由于某种原因,该值溢出了: #include #include #
我试着编写一个基本的编译时版本的std::accumulate()通过定义一个类模板,该模板将递归迭代给定范围并在每次迭代时添加元素。 在 Ubuntu 14.04 上使用 gcc 4.8.4 编译测
我刚刚写了一个小的辅助函数作为 std::accumulate 的包装: template inline auto accumulate(FwdIter begin, FwdIter end) ->
需要以下示例的更漂亮的解决方案,但需要使用 std::accumulate。 #include #include #include class Object { public: Obje
是否可以指示 Redis 累积一组操作,然后发出“publish all”命令来发布整组操作(按线性顺序)? 所以你会以某种方式设置一个标记(startpublish ?)并且缓存会累积从中接收到的所
我是一名优秀的程序员,十分优秀!