- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在我的代码中,我使用结构来促进将参数传递给函数(我不使用结构数组,而是一般使用数组结构)。当我在 cuda-gdb 中时,我检查内核中的点,在该点上我给一个简单的结构赋值,例如
struct pt{
int i;
int j;
int k;
}
尽管我没有做一些复杂的事情,而且很明显成员应该指定值(value)观,但我明白......
Asked for position 0 of stack, stack only has 0 elements on it.
所以我在想,即使它不是一个数组,也许当时的内存对齐有问题。所以我将头文件中的定义更改为
struct __align__(16) pt{
int i;
int j;
int k;
}
但是,当编译器尝试编译使用相同定义的主机代码文件时,会出现以下错误:
error: expected unqualified-id before numeric constant error: expected ‘)’ before numeric constant error: expected constructor, destructor, or type conversion before ‘;’ token
那么,我应该对主机和设备结构有两种不同的定义吗???
此外我想问一下如何概括对齐的逻辑。我不是计算机科学家,因此编程指南中的两个示例并不能帮助我了解全局。
比如下面两个应该如何对齐?或者,具有 6 个 float 的结构应该如何对齐?还是4个整数?再说一遍,我没有使用这些数组,但我仍然在内核或 _ device _ 函数中使用这些结构定义了很多变量。
struct {
int a;
int b;
int c;
int d;
float* el;
} ;
struct {
int a;
int b
int c
int d
float* i;
float* j;
float* k;
} ;
提前感谢您的任何建议或提示
最佳答案
这篇文章有很多问题。由于 CUDA 编程指南在解释 CUDA 中的对齐方面做得非常好,因此我将只解释指南中不明显的一些内容。
首先,主机编译器给你错误的原因是主机编译器不知道 __align(n)__
是什么。意味着,所以它给出了语法错误。您需要的是将如下内容放入项目的 header 中。
#if defined(__CUDACC__) // NVCC
#define MY_ALIGN(n) __align__(n)
#elif defined(__GNUC__) // GCC
#define MY_ALIGN(n) __attribute__((aligned(n)))
#elif defined(_MSC_VER) // MSVC
#define MY_ALIGN(n) __declspec(align(n))
#else
#error "Please provide a definition for MY_ALIGN macro for your host compiler!"
#endif
So, am I supposed to have two different definitions for host and device structures?
不,只需使用 MY_ALIGN(n)
,像这样
struct MY_ALIGN(16) pt { int i, j, k; }
For example, how should the following two be aligned?
首先,__align(n)__
(或任何主机编译器风格),强制结构体的内存从内存中的地址开始,该地址是 n
的倍数。字节。如果结构体的大小不是 n
的倍数,然后在这些结构的数组中,将插入填充以确保每个结构正确对齐。为n
选择合适的值,您希望最小化所需的填充量。如编程指南中所述,硬件要求每个线程读取与 1、2、4、8 或 16 字节对齐的字。所以...
struct MY_ALIGN(16) {
int a;
int b;
int c;
int d;
float* el;
};
在本例中,假设我们选择 16 字节对齐。在 32 位机器上,指针占用 4 个字节,因此结构体占用 20 个字节。 16字节对齐会浪费16 * (ceil(20/16) - 1) = 12
每个结构的字节数。在 64 位机器上,由于 8 字节指针,每个结构只会浪费 8 字节。我们可以通过使用MY_ALIGN(8)
来减少浪费反而。权衡是硬件必须使用 3 个 8 字节加载而不是 2 个 16 字节加载来从内存加载结构。如果您没有受到负载的瓶颈,这可能是一个值得的权衡。请注意,您不想为此结构对齐小于 4 个字节的字节。
struct MY_ALIGN(16) {
int a;
int b
int c
int d
float* i;
float* j;
float* k;
};
在这种情况下,使用 16 字节对齐,在 32 位计算机上每个结构只浪费 4 个字节,在 64 位计算机上浪费 8 个字节。它需要两次 16 字节加载(或 64 位机器上 3 个)。如果我们对齐到 8 字节,我们可以通过 4 字节对齐(64 位机器上为 8 字节)完全消除浪费,但这会导致过多的负载。再次强调权衡。
or, how should a structure with 6 floats be aligned?
再次权衡:要么每个结构浪费 8 个字节,要么每个结构需要两次加载。
or 4 integers?
这里没有权衡。 MY_ALIGN(16)
.
again, I'm not using arrays of those, but still I define lots of variables with these structures within the kernels or _ device _ functions.
嗯,如果您不使用这些数组,那么您可能根本不需要对齐。但你如何分配给他们呢?正如您可能看到的,所有这些浪费都是值得担心的——这是支持数组结构而不是结构数组的另一个很好的理由。
关于cuda内存对齐,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12778949/
我希望能够像在 jsFiddle 中那样将元素列表对齐到右侧的复选框。这是如何做到这一点的最佳实践?传统上我从来没有 float 过相互嵌套的元素,所以我想确定这是否是解决此问题的正确方法。 代码(h
指令.align n是什么意思在数组中做什么? 更具体地说,假设我有以下部分代码: array: .align 2 .space 800 它的重要性是什么,为什么不跳过它并使用
基本上我正在寻找一种强制特定相对对齐的方法 即我想保证其他一些值(value) m s.t m > n alignment_of(foo) % 2^m == 2^n IE: .align 2^m; .
在我的代码中,我必须考虑一个数组数组,其中内部数组具有固定维度。为了使用 STL 算法,将数据实际存储为数组的数组很有用,但我还需要将该数据传递给 C 库,该库采用扁平化的 C 样式数组。 如果能够以
横向上,我想显示两个位图,并在它们之间显示一个标签字段。 代码看起来很简单,但所有字段都添加在屏幕左侧。 HorizontalFieldManager hfm = new HorizontalFiel
我想绘制一个变量名称及其符号。因为某些变量的名称很长,所以我试图将换行符与轴标签混合使用。这会导致对齐中发生有趣的事情: par(mar=c(1,12,1,1)) plot( y=1:6, 1:6,
使用这个脚本 df <- data.frame(x = 1:5, y = 1:5, color = letters[1:5]) ggplot(df, aes(x, y, fill = color))
我有一个带有标量字段的结构,比如妈妈,我想在屏幕上对齐的列中显示结构的值,可能还有一些标题。这是一个最小的工作示例: mom.a = 1; mom.b = 2; mom.veryLongName =
在 iOS6 中,我使用自动布局。 我有 2 个以编程方式创建的 View v1 和 v2。 v2 作为 subview 添加到 v1 v1 的约束已通过编程方式创建(此处未显示)。 我希望 v1 和
概述 浏览时operator new, operator new[] - cppreference.com ,似乎我们有许多选项来分配具有特定对齐要求的对象数组。但是,没有指定如何使用它们,而且我似乎
Widget _createProfileContainer() { return new Container( height: 64.0, child: ne
我正在使用 Bootstrap 和语义 UI 的组合来设计和对齐我的网页。目前,我在将页面 api map 和博客文章在整个页面上对齐时遇到问题,而不是像图像所示 那样堆叠在一起。 这是我的底层代码,
所以我已经添加了标签和所有内容,但我仍然在格式化和对齐所有内容时遇到问题。计算按钮显然应该居中。我知道使用 gridbag 将框架分割成坐标系,当一列大于其他列时,它会调整其他列并将其抛弃(对吗?)。
我必须将程序上的按钮对齐到中间,我运行的当前代码但显示的按钮与程序一样大,我想要一个特定大小的中心按钮,这是我尝试过的 /** * Created by Timk9 on 11/04/2016.
我正在尝试将 VIM 作为我的 ruby/rails 编辑器。太胖了,我对它的功能印象深刻 并且我能够安装以下插件以提供更好的 IDE 体验 自动配对 Better-snipmate-snippe
在结构内对齐成员的最佳或常规方法是什么?添加虚拟数组是最佳解决方案吗? 我有一个 double 的结构和 double 的三倍是吗? struct particle{ double mass;
我正在尝试对齐我的输出,但由于某种原因我无法做到我多么想要它,这真的很令人沮丧。标题不会正确对齐。我不知道我是否正确使用了 setw()。 #include using std::cout; usi
我正在开发一个 android 应用程序,其相对布局如下所示。 这是应用程序在屏幕上的显示方式的 imgur 链接:http://imgur.com/c4rNJ .我希望“Text 1”出现在“a l
我不确定为什么我不能在下面的代码中调整按钮的位置。我有几行设置了边界,但我一定遗漏了一些东西。 public DayGUI() { mainFrame = new JF
我有一个 html 页面,我想在页面底部对齐一个 iframe,使 iframe 占据所有宽度,我无法在底部对齐 iframe。请找到底部的 iframe 标签页面。 The rest of th
我是一名优秀的程序员,十分优秀!