- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我搜索并阅读了一些关于不连贯内存访问的 wiki,例如 https://en.wikipedia.org/wiki/Memory_coherence , https://www.khronos.org/opengl/wiki/Memory_Model
据我所知,内存访问不连贯的主要原因是同一内存地址的多个本地缓存。在缓存内存架构中,处理器通常不直接访问内存,而是访问缓存。对于多处理器系统,每个处理器都有自己的缓存但共享一个内存,这可能会导致同一内存地址的多个副本。因此,即使在另一个进程写入该地址后,一个处理器也可能读取该内存地址的旧数据。
但是,共享变量应该位于缓存中,并且只能由在同一处理器上执行的同一工作组内的调用访问。因此不应存在多个版本的共享变量。即使共享变量的大小超过缓存的最大大小,部分数据也会在内存中,共享变量只存在于一个缓存中。为什么对共享变量的访问不连贯?
此外,通过工作组内的调用访问连贯图像/缓冲区变量是否不连贯?
据我了解,计算着色器中存在两种障碍。
barrier
函数,用于控制shader代码的执行,确保前面的写操作确实发生在后面的读操作之前。不连贯的内存访问
意味着着色器调用写入的值不一定对其他调用可见,即使读取操作发生在写入操作之后也是如此。内存屏障就是用来处理这种情况的。我真正想问的是,对于一个工作组的调用,我刚才描述的不一致的内存访问
是否会发生在共享、缓冲区或图像变量上?换句话说,对于一个工作组的调用,如果我使用 barrier
来确保读取操作发生在写入操作之后,写入的值是否对读取操作可见?
以我的思维方式,在上述情况下,写入值对于后读操作始终可见。因为,一个工作组只在一个计算单元上执行,因此同一内存地址不存在多个缓存。但我不确定。
最佳答案
工作组大小限制通常比实际执行单元的波前/扭曲大小大很多倍。将调用收集到工作组中的目的是能够让它们共享信息并在它们之间设置执行障碍。
如果一个工作组大于一个调用子组(或者如果由于发散条件执行而导致执行发散),共享内存仍然需要工作。如果波前大小为 32,但您的工作组大小为 128,当调用编号 97 位于不同的波前时,它们如何读取调用 2 写入的数据?
一个实现可以在同一个计算单元上顺序执行它们。执行前 32 次调用,然后执行下一次,依此类推。这会将所有共享内存保存在本地存储中,但是您如何读取另一个调用写入的数据?您需要一个执行屏障,以便实现知道停止执行当前 32 并移动到工作组中的下一个波前。内存访问是不连贯的,因为在没有显式屏障的情况下,您甚至无法知道哪些调用执行了写入。
此类工作组的任何串行执行方式都意味着共享内存必须在不同的计算单元之间共享。这意味着缓存。
关于opengl - 为什么写入计算着色器的共享变量不一致的内存访问?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72610891/
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Recreating a Dictionary from an IEnumerable 在 Dictiona
是否可以使用命令行版本的 ImageMagick 修剪图像(比如带有 alpha 的 PNG),使输出图像的宽度和高度都是偶数(不是奇数)? 准确地说,应该先修剪输出图像,然后用透明像素填充。我需要这
我有一个订单的Map,可以由许多不同的线程访问。我想控制访问,所以考虑以下简单的数据结构+包装器。 public interface OrderContainer { boolean cont
我有以下代码,现在只是 div 中的一个 Logo ,但我正在尝试添加一些导航单元格,稍后我将对其进行样式设置。问题是,我似乎无法让它们与(除此之外) Logo “一致”,它们总是下降到下一行。我做错
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 9 年前。 Improve this qu
有没有办法将种子值传递给 d3-cloud 或其他基于 javascript 的标签云,以使其在页面加载之间保持一致? 我们的客户希望使用标签云作为导航/发现辅助工具,但由于 d3-cloud 会在每
我有一条由用户使用 D3.js 绘制的路径。 我想在我的用户绘制路径上定义一个破折号数组,但是,随着它改变其形状和长度,破折号的行为不一致并且间隙在移动并变得越来越小。 这是一个代码笔: https:
只是为了研究UINavigationBar和UIStatusBar的UI,我把Navigation Bar Style改成了Black,并且取消勾选Bar visibility,即Shows Navi
我最近在我的家用机器 (OSX 10.9) 和我的远程服务器 (Ubuntu 12.04 64 位) 上安装了 unison。 我在这两个地方都安装了 2.40.102 版本。我在我的 Mac 上使用
我正在使用 migrate 创建 SQL 数据库模式并用初始数据填充它。后来使用 SQLAlchemy 来处理这个数据库。 我如何测试我的 SQLAlchemy 模型是否与 migrate 生成的真实
道歉对这一切来说还是新鲜事。我正在创建一个网页,并在两个单独的 div 中将图像和文本并排放置。我已经设法将它们放在页面上我想要的位置,但是当我调整页面大小时,文本会调整大小,但图像不会。我希望文本底
在翻阅Cassandra和HBase的阅读资料时,我发现Cassandra并不一致,但HBase是一致的。没有找到任何合适的阅读 Material 。 有人可以提供有关此主题的任何博客/文章吗? 最佳
我需要计算 MacOS 中文件夹的大小。该尺寸值必须与 Finder 一致。我尝试了几种方法来做到这一点。但结果总是与Finder不同。 以下方法是我尝试过的。 typedef struct{
问:我可以使用 C++ 中的任何编译时机制来自动验证模板类方法集是否从类特化到特化相匹配? 示例:假设我想要一个类接口(interface),它根据模板值专门化具有非常不同的行为: // forwar
我想使用 SelectKBest 选择前 K 个特征并运行 GaussianNB: selection = SelectKBest(mutual_info_classif, k=300) data_t
我想要一个位于页面中央的 div,其中包含一行(两个单词)的 h1 文本,并且该文本与 div 的长度对齐;意思是,字母留出空间(同时保持它们的大小)以占据 div 的整个宽度,并且不要超出 div。
我试图更新我的服务器,所以我通过 ssh 运行以下命令: sudo do-release-upgrade 我收到以下错误: Errors were encountered while processi
我想验证单应矩阵会给出好的结果,而这个 this answer 有答案 - 但是,我不知道如何实现答案。 那么谁能推荐我如何使用 OpenCV 计算 SVD 并验证第一个奇异值与最后一个奇异值的比率是
我最近更新到 cocoapods 0.36 并对内部规范做了一些更改,现在 podspec 不再有效。我用 0.35 验证了此规范的先前版本 (0.3.8),但使用 0.36 失败。很明显 cocoa
我有两个并排设置的 TableView ,我需要它们同时滚动。因此,当您滚动一个时,另一个也会同时滚动。 我进行了一些搜索,但找不到任何信息,但我认为这一定是有可能的。 我的 TableView 都连
我是一名优秀的程序员,十分优秀!