asynchronous - F# 中多核并行中缓存局部性的最佳实践-6ren

asynchronous - F# 中多核并行中缓存局部性的最佳实践

转载作者：行者123 更新时间：2023-12-03 10:25:49

25

4

我正在研究 F# 中的多核并行性。我不得不承认，不变性确实有助于编写正确的并行实现。然而，当核心数量增加时，很难实现良好的加速和良好的可扩展性。例如，我对快速排序算法的经验是，许多尝试以纯函数方式并使用 List 来实现并行快速排序。或 Array因为代表失败了。分析这些实现表明，与顺序版本相比，缓存未命中的数量显着增加。但是，如果使用数组内部的变异实现并行快速排序，则可以获得良好的加速。因此，我认为变异可能是优化多核并行性的好方法。

我相信 cache locality是函数式语言中多核并行的一大障碍。函数式编程涉及创建许多短期对象；破坏这些对象可能会破坏 CPU 缓存的一致性属性。我已经看到了很多关于如何在命令式语言中提高缓存局部性的建议，例如，here和 here .但是我不清楚它们将如何在函数式编程中完成，尤其是对于经常出现的递归数据结构，如树等。

是否有任何技术可以在不纯的函数式语言(特别是 F#)中提高缓存局部性？任何建议或代码示例都非常受欢迎。

最佳答案

据我所知，缓存局部性(多线程或其他)的关键是

将工作单元保存在适合缓存的连续 RAM block 中

为此 ;

尽可能避开物体

对象是在堆上分配的，并且可能会散布到各处，这取决于堆碎片等。

您对对象的内存位置的控制基本上为零，以至于 GC 可能随时移动它们。

使用数组。大多数编译器将数组解释为连续的内存块。

其他集合数据类型可能会将事物分布在各处 - 例如，链表由指针组成。

使用原始类型的数组。对象类型是在堆上分配的，因此对象数组只是指向可能分布在整个堆中的对象的指针数组。

如果不能使用原语，请使用结构数组。结构的字段在内存中按顺序排列，并被 .NET 编译器视为基元。

计算出您将在其上执行缓存的机器上的缓存大小

CPU 有不同大小的二级缓存

谨慎设计代码以适应不同的缓存大小

或者更简单地说，编写适合您的代码将在

上运行的最低公共(public)缓存大小的代码。

计算出需要靠近每个基准的位置

在实践中，您不会将整个工作集放入二级缓存

检查(或重新设计)您的算法，以便您使用的数据结构将“下一个”需要的数据保存在之前需要的数据附近。

在实践中，这意味着您最终可能会使用在理论上不是计算机科学完美示例的数据结构 - 但没关系，计算机也不是计算机科学理论上完美的示例。

一篇关于该主题的优秀学术论文是 Cache-Efficient String Sorting Using Copying

关于asynchronous - F# 中多核并行中缓存局部性的最佳实践，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6185952/

25

4

0

文章推荐： Eclipse - 导出/保存搜索结果

文章推荐： javascript - 输入 :checkbox unchecked and with ID 的 Jquery 选择器

文章推荐： Asp.Net MVC3 到 MVC4 升级工具？

macos - react 性 cocoa 中的管道转发运算符(operator)在行动中失踪，是的，我已经导入了 react 性 cocoa
我在 Mac OsX 10.11 上使用 Xcode 7.0.1 (7A1001) 我使用 carthage 0.9.2 通过以下购物车文件下载reactivecocoa github“Reactiv
laravel - 如何避免vue中的 react 性
我正在将一个对象从属性“模型”(我从 Laravel 中的 Blade 属性模型中获得)分配给数据属性模型。后来数据属性模型发生变化，因为它绑定(bind)到表单输入字段。但 Prop “模型”也发生
javascript - 数组内对象的属性更改的 react 性
当我更新数组内对象的属性然后作为组件的 Prop 传递时，在 svelte 中触发 react 性的正确方法是什么？ let items = [{ id: 1, name: 'first'
dry - 是否有自动工具来查找代码库的 DRY 性？
我是 DRY principle 的坚定拥护者: Every piece of knowledge must have a single, unambiguous, authoritative rep
multithreading - 如何保持线程的消息泵 react 性
我正在实现一个需要以下功能的线程: 及时响应终止请求推送消息在等待消息时保持对 SendMessage 请求的响应我对消息泵的初始实现使用了 GetMessage，如下所示: while not
meteor - 暂停实时数据或游标的 react 性
在我的应用程序中，用户获得了一份已到达她的文档列表，并且可以对每个文档执行操作。文件是分批提交的，当这种情况发生时，列表会增加。这一切都很好，这是预期的行为，但最好有一个按钮“暂停实时数据”，它会忽
javascript - 简单的重构会消除 react 性
我有一个属性为的数据对象 displaySubtotal 我可以通过以下方式更新该属性的值: data.displaySubtotal = numPad.valueAsAString(); 我的方法
javascript - 自定义小部件的 react 性
我需要一个垂直 slider 输入。由于内置的 sliderInput 函数无法做到这一点，因此我选择自己实现。根据this thread可以 (I) 使用 CSS 旋转 sliderInput
javascript - 我应该如何保持我的出版物的 react 性？
我正在从自定义用户权限管理系统迁移到 Alanning:roles v2.0 .我有一个非常基本的结构: 基本用户用户组，每个用户组都有特定的设置。我将它们存储在一个“组”集合中。管理群组的用户的
r - 条件 react 性 Shiny
Shiny 中的响应式(Reactive)表达式将更改传播到需要去的地方。我们可以使用 isolate 来抑制一些这种行为。，但是我们可以抑制基于我们自己的逻辑表达式传播的更改吗？我给出的例子是一
Haskell:FRP react 性 Parsec？
是否有(或可能有) react 性 Parsec (或任何其他纯函数式解析器)在 Haskell 中？简而言之，我想逐个字符地为解析器提供数据，并获得与我提供的足够多的结果一样多的结果。或者更简单
javascript - 将输入字符串与文本/元素匹配并突出显示 react 性
HTML(JADE) p#result Lorem ipsum is javascript j s lo 1 2 4 this meteor thismeteor. meteor input.sear
javascript - svelte 如何处理导入内部的 react 性
我有一个被导入函数更改的对象。 https://svelte.dev/repl/e934087af1dc4a25a1ee52cf3fd3bbea?version=3.12.1 我想知道如何使我的更改反
image - 如何在YUV 420半平面图像中应用单应性/ react 性？
我有一个YUV 420半平面格式的图像，其中字节以这种方式存储: [Y1 Y2 ... [U1 V1.... Yk Yk+1...] Uk' Uk'+1] 其中Y平面的大小是UV平面的两倍，并
objective-c - react 性 NSMutableDictionary？
如何使用 ReactiveCocoa 订阅从 NSMutableDictionary 添加和删除的对象？另外，我想在它发生变化时广播通知。我的猜测是可以使用 RACMulticastConnectio
r - Shiny:允许用户选择 react 性
我正在构建一个带有多个选项卡的应用程序，其中一些选项卡涉及过多的计算，而另一些选项卡的计算速度很快。一个允许用户在 react 性或手动更新之间进行选择的复选框，与“刷新”按钮结合使用，将是理想的选择
meteor - 关闭内容可编辑区域的 react 性 (Meteor)
我知道您可以在获取集合时使用 reactive: false 关闭 react 性。如何在内容可编辑区域内的集合字段中实现相同的效果？示例: Template.documentPage.events(
z3 - z3 的解决方法不支持注入(inject)性
我想在 z3 中表示一个哈希函数，比如 SHA(x)。在做了一些研究之后，似乎 z3 不能很好地支持注入(inject)性，所以我不能有像这样的约束(虽然我意识到这并不是严格意义上的碰撞，但作为一种启
javascript - Meteor 中的模板级 react 性
我正在解决一个问题，我想在仪表板中将数据显示为图表(通过 perak:c3 )和表格(通过 aslagle:reactive-table )。我的问题是数据是从 MongoDB 中的集合中提取的，它的
swift - react 性 cocoa 信号不起作用
我的 ViewModel 中有这个函数，它返回一个信号，但内部 block 不起作用，我尝试添加断点，但它没有中断。这是我的代码。 func executeLoginAPI() -> RACSigna

首页

博学

6Ren·AI

商城

asynchronous - F# 中多核并行中缓存局部性的最佳实践