- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个cuda内核,它带有一些bool
模板参数,这些参数有助于显式优化内核的未使用部分。我想知道是否有比下面的解决方案更简洁的实例化内核调用的方法。
设备模板
template <bool pred1, bool pred2>
__global__ void foo(args)
{
/* probably doesn't need to exist, but just to improve readability in the kernel */
constexpr bool predAll = pred1 && pred2;
if (predAll || pred1 || pred2 || someVariablePred) {
/* working hard */
} else {
/* or hardly working */
}
}
工作主机代码
const bool pred1 = variableCond1 == variableCond2, pred2 = variableCond3 == variableCond4;
/* working, compiles, but cumbersome */
for (int i = 0; i < bigNumber; ++i) {
if (pred1) {
if (pred2) {
foo<true, true><<<dimGrid, dimBlock>>>(args...);
}
foo<true, false><<<dimGrid, dimBlock>>>(args...);
} else if (pred2) {
foo<false, true><<<dimGrid, dimBlock>>>(args...);
} else {
foo<false, false><<<dimGrid, dimBlock>>>(args...);
}
}
想要像这样的干净东西
/* doesn't compile */
const bool pred1 = variableCond1 == variableCond2, pred2 = variableCond3 == variableCond4;
for (int i = 0; i < bigNumber; ++i) {
foo<pred1, pred2><<<dimGrid, dimBlock>>>(args...);
}
我知道为什么谓词在编译时不会显式地写出/不知道,为什么第二次内核启动不会编译,但是由于模板参数组合的数量有限,因此技术上信息在编译时就全部存在了吗?
最佳答案
好吧,有很多方法,但是它们比当前的实现需要更多的行。而且我不确定以下实现是否会提高可读性,而不仅仅是将“不干净的”部分放在单独的函数中。
以下代码可能比为您准备的代码更长,因为我实现了两种方法(直接调用和获取函数指针)和两个示例来证明它确实有效。
#include <iostream>
#include <string>
template <bool pred0, bool pred1, bool pred2, bool pred3, bool pred4>
void Func1()
{
std::cout << "func1: " << pred0 << pred1 << pred2 << pred3 << pred4 << std::endl;
}
template <bool pred0, bool pred1, bool pred2, bool pred3, bool pred4>
struct Func1Wrapper
{
static constexpr auto Ptr = Func1<pred0, pred1, pred2, pred3, pred4>;
static void Call()
{
Func1<pred0, pred1, pred2, pred3, pred4>();
}
};
template <bool pred0, bool pred1, bool pred2>
void Func2()
{
std::cout << "func2: " << pred0 << pred1 << pred2 << std::endl;
}
template <bool pred0, bool pred1, bool pred2>
struct Func2Wrapper
{
static constexpr auto Ptr = Func2<pred0, pred1, pred2>;
static void Call()
{
Func2<pred0, pred1, pred2>();
}
};
template <template<bool...> class F, bool... preds>
struct Ct
{
template <bool newPred>
using Expanded = Ct<F, preds..., newPred>;
static void CallFunc()
{
F<preds...>::Call();
}
static auto GetFunc()
{
return F<preds...>::Ptr;
}
};
template <class DeducedPreds, typename BoolLast>
void Rt2Ct(BoolLast predLast)
{
if (predLast)
DeducedPreds::template Expanded<true>::CallFunc();
else
DeducedPreds::template Expanded<false>::CallFunc();
}
template <class DeducedPreds, typename BoolFirst, typename ...BoolRest>
void Rt2Ct(BoolFirst predFirst, BoolRest... predRest)
{
if (predFirst)
Rt2Ct<typename DeducedPreds::template Expanded<true>, BoolRest...>(predRest...);
else
Rt2Ct<typename DeducedPreds::template Expanded<false>, BoolRest...>(predRest...);
}
template <template<bool...> class F, typename ...Bools>
void FuncCaller(Bools... preds)
{
Rt2Ct<Ct<F>, Bools...>(preds...);
}
template <class DeducedPreds, typename BoolLast>
auto Rt2CtGet(BoolLast predLast)
{
if (predLast)
return DeducedPreds::template Expanded<true>::GetFunc();
else
return DeducedPreds::template Expanded<false>::GetFunc();
}
template <class DeducedPreds, typename BoolFirst, typename ...BoolRest>
auto Rt2CtGet(BoolFirst predFirst, BoolRest... predRest)
{
if (predFirst)
return Rt2CtGet<typename DeducedPreds::template Expanded<true>, BoolRest...>(predRest...);
else
return Rt2CtGet<typename DeducedPreds::template Expanded<false>, BoolRest...>(predRest...);
}
template <template<bool...> class F, typename ...Bools>
auto FuncGetter(Bools... preds)
{
return Rt2CtGet<Ct<F>, Bools...>(preds...);
}
int main(int argc, char* argv[])
{
FuncCaller<Func1Wrapper>(std::stoi(argv[1]), std::stoi(argv[2]), std::stoi(argv[3]), std::stoi(argv[4]), std::stoi(argv[5]));
auto f2 = FuncGetter<Func2Wrapper>(std::stoi(argv[1]), std::stoi(argv[3]), std::stoi(argv[5]));
f2();
return 0;
}
该代码要求使用C++ 14(只需稍加重写就可以实现C++ 11),并且没有CUDA,因为我真的看不到调用内核而不是普通函数是如何解决此问题的。当然,您将必须添加一些参数来传递
dimGrid
和
dimBlock
以及所需的所有
args
。
if-else
内容放到
for
循环之外。这就是为什么我还实现了
FuncGetter
例程的原因。
Bools
,
BoolFirst
等模板参数确实是
bool
类型。
$ g++ -std=c++14 main.cpp && ./a.out 1 0 1 0 0
func1: 10100
func2: 110
关于c++ - 避免模板分支的最干净方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64718600/
我们将 Azure Boards(与敏捷流程相关的项目)定义为“功能”>“史诗”>“任务”>“用户故事”。 在我们的Azure Boards(Boards >Board)中,它仅显示Epic和Feat
我正在编写一个 C++ 井字游戏,这是我目前拥有的: #include using namespace std; int main() { board *b; b->draw();
这是一个足够简单的问题。 看完documentation for ion-pane它指出: A simple container that fits content, with no side eff
关闭。这个问题是opinion-based .它目前不接受答案。 想改进这个问题?更新问题,以便 editing this post 可以用事实和引用来回答它. 4年前关闭。 Improve this
我正在用 javascript 对 arduino 开发板进行编程。我正在尝试使用 johnny-five 库连接多个 arduino 板。我关注了johnny-five documentation我
在我的 Java 类(class)中,我们正在学习《Java 基础知识》一书的第 4 章。我正在做项目 4-11,它是一个黑色和红色的棋盘格,但是我得到随机颜色,我试图按照本书教我们使用 ColorP
我正在制作一个数独板 GUI,它应该看起来像这样 http://www.sudoku.4thewww.com/Grids/grid.jpg 由于某种原因,它只显示最后一个 3*3 板。如果有人能告诉我
我正在开发一款带有二维阵列(游戏板)的新游戏。每个单元格/图 block 都有一定数量的点。 我想实现的是一个算法能找到核心最高的最短路径。 所以我首先实现了 Dijkstra 算法(下面的源代码)来
更新:(2015-10-16)[已解决!]-使用trigger()并通过slice()限制为50个引脚固定。 非常感谢Abhas Tandon通过提供使用 $(this).trigger('click
关闭。这个问题需要更多focused .它目前不接受答案。 想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post . 7年前关闭。 Improve this questi
var size = 8; var board = ""; for (var y = 0; y x= (x+y) % 2 = 关于javasc
我正在制作一个简单的游戏,需要我创建一个由用户定义大小的棋盘。 我一直在编写一个函数,该函数应该返回我将在我的游戏中使用的棋盘(矩阵),但我似乎无法让它工作。 我尝试使用嵌套的 for 循环方法在 m
我正在尝试让板模板引擎与 express.js 一起工作。我最初的尝试是这样的: app.register('.html', { compile: function (str, options
我正在测试 Azure Boards Rest API。我目前可以成功创建、删除和获取项目,但我似乎无法在列之间移动它们。 这是我的要求https://{{AzureBoardsToken}}@{{A
我想用 trello api 归档一个板/列表,但我找不到解决方案。 与 https://trello.com/docs/api/list/#post-1-lists-idlist-archiveal
我上传了 sketch到一个 Arduino Uno,它的循环是这样的: void loop(){ Serial.println("Hello, World!"); } 所以,现在,我无法再上
我想要进行一个查询,显示结构 Epic -> 功能 -> 发布 -> 用户故事 -> 任务,以及特定迭代路径下的所有待处理任务 我尝试使用工作项树,但它只显示到 mu 用户故事 我的 Azure De
我在 python 中使用来自 Opencv 的 Charuco 标记。我之前使用的是 Aruco 开发板,我可以选择创建一个带有 id 偏移量(例如:偏移量为 40)的开发板。 from cv2 i
我不知道如何将另一个 View 中的辅助 Anchorpane 设置到主 View 的边界(在 fxml 代码中,它将是名为 holderPane 并且有灰色区域),这样当窗口展开时,它也会随之拉伸(
如何使用包含列、行和堆栈(包含 4、3、2、1)的 3D 通用数组制作一 block 板。 这是我声明的: private int row, col, stack; int[][][] array3D
我是一名优秀的程序员,十分优秀!