- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
更新:我让每个节点写入一个单独的文件,当单独的文件连接在一起时,结果是正确的。我还更新了代码以尝试在每次写入单个记录后进行 channel 刷新和文件同步,但现在节点 0 和 1 之间仍然存在问题。如果我在节点 0 开始其 coforall
循环迭代之前让节点 0 休眠几秒钟,记录就会正确无误。否则,节点 0 记录的最后几百个字节似乎会被 NULL 字节可靠地覆盖,直到节点 1 记录的开头。节点 1 和节点 2、节点 2 和节点 3 之间的问题似乎不再出现。
此外,如果我抑制节点 0 或节点 1 写入,我会看到来自未抑制节点的完整记录已正确写入文件。在节点 1 被抑制的情况下,我在文件中看到 9,997 100B 记录(或 999,700)正确字节后跟 NULL 字节,节点 1 的抑制记录将去往该文件。在节点 0 被抑制的情况下,我在文件中看到恰好 999,700 个 NULL 字节,之后节点 1 的记录开始。
原帖:
我正在尝试解决从不同节点并行写入磁盘上支持 NFS 的共享文件的问题。目前,我怀疑 NFS 服务器上写入磁盘的方式有问题。
我正在调整使用 pwrite
写入文件协调 block 的 MPI+C 代码。如果我尝试让 Chapel 中的等效语言环境写入 coforall
循环内的文件,我最终会弄乱节点边界周围的文件位 - 通常是最后几百个字节每个节点的数据都是乱码。但是,如果我只有一个语言环境遍历所有语言环境的数据并写入,数据就会正确输出。也就是说,我使用相同的数据结构来计算偏移量,但只有区域设置 0 寻找该偏移量并执行写入。
我已验证每个语言环境运行的文件中的偏移量不重叠,并且我为每个任务使用一个 channel ,从 on loc do
block 中定义,因此任务不共享单个 channel 。
从不同区域设置写入文件是否存在已知问题?许多文档使这看起来似乎是安全的,但未经证实的猜测似乎表明文件内容缓存存在问题;在检查不正确的数据时,不正确的位似乎是程序开始时该位置文件中的原始数据。
我在下面包含了相关例程,以防您轻松发现我遗漏的内容。为了制作这个系列,我将 coforall loc in Locales
和 on loc do
block 转换为 for j in 0..numLocales-1
循环,并将 here.id
替换为 j
。请让我知道还有什么可以帮助弄清这件事的真相。谢谢!
proc write_share_of_data(data_filename: string, ref record_blocks) throws {
coforall loc in Locales {
on loc do {
var data_file: file = open(data_filename, iomode.cwr);
var data_writer = data_file.writer(kind=ionative, locking=false);
var line: [1..100] uint(8);
const indices = record_blocks[here.id].D;
var local_record_offset = + reduce record_blocks[0..here.id-1].D.size;
writeln("Loc ", here.id, ": record offset is ", local_record_offset);
var local_bytes_offset = terarec.terarec_width_disk * local_record_offset;
data_writer.seek(start=local_bytes_offset);
for i in indices {
var write_rec: terarec_t = record_blocks[here.id].records[i];
line[1..10] = write_rec.key;
line[11..98] = write_rec.value;
line[99] = 13; // \r
line[100] = 10; // \n
data_writer.write(line);
lines_written += 1;
}
data_file.fsync();
data_writer.close();
data_file.close();
}
}
return;
}
最佳答案
在此处添加解决了我的特定问题的答案,但它没有解释所见行为。我最终将外循环从 coforall loc in Locales
更改为 for loc in Locales
。这不是一个太大的问题,因为无论如何它都是写入一个文件 - 我怀疑多个语言环境实际上可以在所有尝试并发写入 NFS 服务器上的单个文件方面取得很大进展。因此,更改仍然允许节点将它们在本地拥有的数据写入 NFS,而不是强制节点 0 代表所有区域收集数据然后写入数据。这相当于仅向写入操作添加空闲时间,该空闲时间与前一个节点完成写入时 Locale 0 在其他节点上启动远程任务所花费的时间相称,这对于手头的应用程序来说不是问题。
关于chapel - 并行写入 NFS 支持的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73007716/
Chapel 中是否有用于关联和/或不透明域的分布式域映射的工作示例,或者关于如何在多个区域设置上分布非矩形结构(例如图形)的任何提示?我了解分布式稀疏数组,但我正在研究结构化程度较低的数据。该文档提
Chapel 似乎专注于 n 维数组和固定大小的元组。乍一看,似乎没有动态数据结构。 一个特殊的问题是您似乎必须预先声明关联数组的大小。其他语言的 map 和词典不受此限制。 Chapel 是否有更动
我有一段 C 代码,如下所示: for(int i = 0; i 。因此,正如您正确预期的那样,从本质上讲,它比 C 代码中的指针数学运算要多。 也就是说,您报告的慢 30-40 倍让我们感到惊讶。我
我正在尝试在 Chapel 中为多语言环境实现一个 SOR、连续过度放松、程序,但使用本地内存,所以我想明确地在语言环境之间分配行。我已经 reshape 了targetlocales到一维,但现在我
在编译过程中,我看到只有一个处理器用于编译。我想知道是否可以选择添加多处理器编译来加快编译过程? 最佳答案 不幸的是,目前还没有。这可能需要等到我们有时间在 Chapel 中重写 Chapel 编译器
我想在数组上写一个函数,但我想要一个泛型类型。为了争论,让我们把它作为一个总和。 proc mySum(x:[] int) { return + reduce x; } proc mySum(x:
考虑以下分散操作: var A : [DomA] EltType; var Indices : [DomA] IndexType; var B : [DomB] EltType; [(iSrc, iD
考虑以下教堂功能: proc myfunc(arr : []?T) {} 我想保证数组(在编译时)是 本地 底层数据存储在一个连续的内存块中。 做这个的最好方式是什么? 一个可能的应用是调用 myfu
跟进this question关于包含源文件。我包括一个 Chapel 模块,其中包含一个名为 classes.chpl 的文件。 ,但我当前的项目也有一个 classes.chpl 。正确的消歧模式
我正在努力提高我的矩阵乘法速度。我可以做其他实现来加快速度吗这是到目前为止我的结果,我尝试执行 8192,但花了 2 个多小时,而且我的 ssh 连接超时。 这是我的实现: use Random, T
似乎我找到了答案,然后又失去了它。我正处于“迷失”的阶段。如果我在 Chapel 中有一个对象,那么相当于 Python 的对象是什么 >>> thing = 'i am a thing' >>> t
我有以下 Chapel 代码,但它似乎效率低下。 class Student { var name: string; proc init(name:string) {this.name
要打印出变量的类型,我通常只使用 writeln(x.type : string); 但是,这不会打印出完全限定的名称(这在调试阴影变量时很有用)。有没有办法做到这一点? 最佳答案 不幸的是,我认为
终止 Chapel 程序时是否可以设置退出状态? 我总是可以使用: extern "exit" proc c_exit(status:c_int); 以下是诀窍。 extern "exit" proc
在 C++ 中,当我需要来自 classes.cpp 的“actions.cpp”中的类时我包括标题,如 #include .但尝试 use classes.chpl失败了,有没有.h等效我应该使用
一点背景:我想在 Chapel 中使用 Crate.io 数据库和 ODBC 驱动程序将我的 API 构建为 Azure(或 AppEngine)上的 docker 容器。 有可以与 Chapel 一
在过去的一年左右的时间里,我一直在尝试Chapel。我过去曾短暂使用过 C 和 C++,但最近我的大部分经验是使用动态语言,如 Python、Ruby 和 Erlang。 在接触了 Erlang 及其
教堂缩减目前忽略变量的初始值。这意味着这段代码 var x: int; for i in 1..3 { forall j in 1..10 with (+ reduce x) { x +=
我如何找出哪些任务正在执行一个迭代的哪些迭代forall 循环? 例如,我想感受一下不同 DynamicIter 的行为方式, use DynamicIters; var r = 1..1000; v
当我尝试将对象转换为字符串时,是否会调用默认方法? (例如 Java 中的 toString 或 Python 中的 __str__。)我希望能够对对象数组执行以下操作,但其中一些可能为零: for
我是一名优秀的程序员,十分优秀!