gpt4 book ai didi

c++ - 如何在 C++ 中正确访问映射内存而没有未定义的行为

转载 作者:IT老高 更新时间:2023-10-28 21:43:04 29 4
gpt4 key购买 nike

我一直试图弄清楚如何在不调用未定义行为的情况下从 C++17 访问映射缓冲区。对于这个例子,我将使用 Vulkan 的 vkMapMemory 返回的缓冲区。 .

所以,根据 N4659 (最终的 C++17 工作草案),第 [intro.object] 节(强调):

The constructs in a C++ program create, destroy, refer to, access, and manipulate objects. An object is created by a definition (6.1), by a new-expression (8.3.4), when implicitly changing the active member of a union (12.3), or when a temporary object is created (7.4, 15.2).

显然,这些是创建 C++ 对象的唯一有效方法。因此,假设我们得到一个 void* 指针,指向主机可见(和一致)设备内存的映射区域(当然,假设所有必需的参数都有有效值并且调用成功,并且返回的内存块足够大并且正确对齐):

void* ptr{};
vkMapMemory(device, memory, offset, size, flags, &ptr);
assert(ptr != nullptr);

现在,我希望以 float 数组的形式访问此内存。显而易见的事情是 static_cast 指针并继续我的快乐方式如下:

volatile float* float_array = static_cast<volatile float*>(ptr);

(包含volatile,因为它被映射为相干内存,因此GPU可以在任何时候写入)。但是,float 数组在该内存位置技术上并不存在,至少在引用摘录的意义上不存在,因此通过这样的指针访问内存会是未定义的行为。因此,根据我的理解,我有两个选择:

1。 memcpy 数据

应该总是可以使用本地缓冲区,将其转换为 std::byte*memcpy representation 到映射区域。 GPU 将按照着色器中的指示解释它(在这种情况下,作为 32 位 float 的数组),从而解决了问题。但是,这需要额外的内存和额外的拷贝,所以我宁愿避免这种情况。

2。放置-new数组

似乎 [new.delete.placement] 部分不对如何获得放置地址施加任何限制(它不必是 safely-derived pointer,无论实现的指针安全性如何)。因此,应该可以通过placement-new 创建一个有效的 float 组,如下所示:

volatile float* float_array = new (ptr) volatile float[sizeInFloats];

指针 float_array 现在应该可以安全访问(在数组的范围内,或过去一次)。


所以,我的问题如下:

  1. 简单的 static_cast 确实是未定义的行为吗?
  2. 此展示位置- 用法是否已明确定义?
  3. 此技术是否适用于类似情况,例如 accessing memory-mapped hardware ?

作为旁注,我从来没有通过简单地转换返回的指针遇到问题,我只是想弄清楚这样做的正确方法是什么,根据标准的字母。

最佳答案

简答

根据标准,涉及硬件映射内存的所有内容都是未定义的行为,因为抽象机器不存在该概念。您应该引用您的实现手册。


长答案

尽管硬件映射内存在标准中是未定义的行为,但我们可以想象任何理智的实现都提供了一些遵守通用规则。一些构造比其他构造更多未定义行为(无论这意味着什么)。

Is the simple static_cast indeed undefined behavior?

volatile float* float_array = static_cast<volatile float*>(ptr);

是的,this is undefined behavior并且已经在 StackOverflow 上讨论过很多次。

Is this placement-new usage well-defined?

volatile float* float_array = new (ptr) volatile float[N];

不,尽管这看起来定义明确,这取决于实现。碰巧,operator ::new[]允许保留一些开销 1, 2 ,除非您检查您的工具链文档,否则您无法知道多少。因此,::new (dst) T[N]需要大于或等于 N*sizeof T 的未知内存量和任何 dst您分配的可能太小,涉及缓冲区溢出。

How to proceed, then?

一种解决方案是手动构建一系列 float :

auto p = static_cast<volatile float*>(ptr);
for (std::size_t n = 0 ; n < N; ++n) {
::new (p+n) volatile float;
}

或者等效地,依赖于标准库:

#include <memory>
auto p = static_cast<volatile float*>(ptr);
std::uninitialized_default_construct(p, p+N);

这个结构是连续的 N未初始化 volatile float ptr 指向的内存中的对象.这意味着您必须在阅读它们之前对其进行初始化;读取未初始化的对象是未定义的行为。

Is this technique applicable to similar situations, such as accessing memory-mapped hardware?

不,再次这确实是实现定义的。我们只能假设您的实现做出了合理的选择,但您应该检查其文档的内容。

关于c++ - 如何在 C++ 中正确访问映射内存而没有未定义的行为,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53340727/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com