c# - 将单线程应用程序迁移到多线程、并行执行、蒙特卡洛模拟-6ren

c# - 将单线程应用程序迁移到多线程、并行执行、蒙特卡洛模拟

转载作者：太空狗更新时间：2023-10-29 18:19:37

26

4

我的任务是采用现有的单线程蒙特卡洛模拟并优化它。这是一个 c# 控制台应用程序，没有数据库访问，它从 csv 文件加载一次数据并在最后写出，所以它几乎只是 CPU 限制，也只使用大约 50mb 的内存。

我已经通过 Jetbrains dotTrace 分析器运行它。在总执行时间中，大约 30% 用于生成均匀随机数，24% 用于将均匀随机数转换为正态分布随机数。

基本的算法是一大堆嵌套的for循环，中间是随机数调用和矩阵乘法，每次迭代返回一个double，它被添加到一个结果列表中，这个列表是周期性的对某些收敛标准进行排序和测试(在检查点，每 5% 的总迭代次数)如果可接受，程序将跳出循环并写入结果，否则它会继续到最后。

我希望开发人员能够权衡:

我应该使用新线程还是线程池
我应该看看 Microsoft Parallels 扩展库
我应该看看 AForge.Net Parallel.For，http://code.google.com/p/aforge/还有其他图书馆吗？

上面的一些教程链接将是最受欢迎的，因为我从未编写过任何并行或多线程代码。

生成大量正态分布随机数然后使用这些随机数的最佳策略。应用程序永远不会在此状态下使用统一随机数，它们总是被转换为正态分布然后被使用。
用于随机数生成的良好快速库(并行？)
我进行此并行时的内存注意事项，我需要多少额外的内存。

当前应用需要 2 小时完成 500,000 次迭代，业务需要将其扩展到 3,000,000 次迭代并每天被调用多次，因此需要进行一些重大优化。

特别想听听使用过 Microsoft Parallels Extension 或 AForge.Net Parallel 的人的意见

这需要相当快地进行生产，所以 .net 4 beta 已经发布，尽管我知道它内置了并发库，我们可以考虑在它发布后迁移到 .net 4释放。目前服务器有 .Net 2，我已经提交了我的开发箱有的 .net 3.5 SP1 升级以供审查。

谢谢

更新

我刚刚尝试了 Parallel.For 实现，但它得出了一些奇怪的结果。单线程:

IRandomGenerator rnd = new MersenneTwister();
IDistribution dist = new DiscreteNormalDistribution(discreteNormalDistributionSize);
List<double> results = new List<double>();

for (int i = 0; i < CHECKPOINTS; i++)
{
 results.AddRange(Oblist.Simulate(rnd, dist, n));
}

收件人:

Parallel.For(0, CHECKPOINTS, i =>
        {
           results.AddRange(Oblist.Simulate(rnd, dist, n));
        });

在模拟中有很多对 rnd.nextUniform() 的调用，我想我得到很多相同的值，这是否可能发生，因为现在是并行的？

也可能是 List AddRange 调用不是线程安全的问题？我看到了这个

System.Threading.Collections.BlockingCollection 可能值得使用，但它只有一个没有 AddRange 的 Add 方法，所以我必须查看那里的结果并以线程安全的方式添加。来自使用过 Parallel.For 的人的任何见解，非常感谢。我暂时切换到 System.Random 进行调用，因为在使用我的 Mersenne Twister 实现调用 nextUniform 时出现异常，可能它不是线程安全的某个数组得到一个索引越界....

最佳答案

首先，您需要了解为什么您认为使用多线程是一种优化——但实际上并非如此。如果您有多个处理器，那么使用多线程将使您的工作负载完成得更快只有，并且最多比您有可用的 CPU 快很多倍(这称为加速).在传统意义上，工作并未“优化”(即工作量并未减少 - 事实上，对于多线程，由于线程开销，工作总量通常会增加)。

因此，在设计您的应用程序时，您必须找到可以并行或重叠方式完成的部分工作。可以并行生成随机数(通过在不同的 CPU 上运行多个 RNG)，但这也会改变结果，因为您会得到不同的随机数。另一种选择是在一个 CPU 上生成随机数，而在不同的 CPU 上生成其他所有内容。这可为您提供最大 3 倍的加速，因为 RNG 仍将按顺序运行，并且仍会占用 30% 的负载。

因此，如果您进行这种并行化，最终会得到 3 个线程:线程 1 运行 RNG，线程 2 生成正态分布，线程 3 执行其余的模拟。

对于这个架构，一个producer-consumer architecture是最合适的。每个线程将从队列中读取其输入，并将其输出生成到另一个队列中。每个队列都应该是阻塞的，因此如果 RNG 线程落后，归一化线程将自动阻塞，直到有新的随机数可用。为了提高效率，我会跨线程传递 100(或更大)数组中的随机数，以避免对每个随机数进行同步。

对于这种方法，您不需要任何高级线程。只使用常规线程类，没有池，没有库。您唯一需要的(不幸的是)不在标准库中的是阻塞队列类(System.Collections 中的队列类不好)。 Codeproject提供一个看起来合理的实现；可能还有其他人。

关于c# - 将单线程应用程序迁移到多线程、并行执行、蒙特卡洛模拟，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1116604/

26

4

0

文章推荐： c# - Windows 应用程序(单击)与 Web 应用程序

文章推荐： python - 为 EC2 配置结构

文章推荐： c# - 用于 C# asp.net 的分析/性能分析的免费或廉价选项？

文章推荐： c# - 使用表单在 C# 中创建输入框

macos - 执行 wine != 执行 `which wine`
我有一个“有趣”的问题，即以两种不同的方式运行 wine 会导致: $> wine --version /Applications/Wine.app/Contents/Resources/bin/wi
javascript - CRONTAB 执行 Python，使用 puppeteer 执行 Node 来进行网页抓取不起作用
我制作了这个网络抓取工具来获取网页中的表格。我使用 puppeteer (不知道 crontab 有问题)、Python 进行清理并处理数据库的输出但令我惊讶的是，当我执行它时 */50 * * *
javascript - 对 javascript 函数的 Objective-C 调用何时被调用/执行，何时不被调用/执行？
JavaScript 是否被调用或执行取决于什么？准确地说，我有两个函数，它们都以相同的方式调用: [self.mapView stringByEvaluatingJavaScriptFromStri
python - 为什么使用 statsmodels 执行 OLS 和使用 scikit 执行 PooledOLS 时会得到相同的结果？
我目前正在使用 python 做一个机器学习项目(这里是初学者，从头开始学习一切)。只是想知道 statsmodels 的 OLS 和 scikit 的 PooledOlS 使用我拥有的相同面板数据
c# - 通过 Enterprise Guide 执行 SAS 和从 .Net 执行 IOM 之间的区别
在使用集成对象模型 (IOM) 后，我可以执行 SAS 代码并将 SAS 数据集读入 .Net/C# 数据集 here . 只是好奇，使用 .Net 作为 SAS 服务器的客户端与使用 Enterpr
javascript - jQuery 不会使用 animate : top 200px function. 执行，但它会使用 animate: height 执行
有一些直接的 jQuery 在单击时隐藏打开的 div 未显示，但仍将高度添加到导航中以使其看起来好像要掉下来了。这个脚本工作正常: $(document).ready(funct
java - 为什么我的代码使用 'IF' 执行 'ELSE' 和 '==' ，但不使用 '.equals' 执行？
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 4 年前。这里是 Java 新手，我正在使用 NetBeans 尝试一些简单的代
python - Keras 2.0.8 仅使用 Python 3.x 执行 1 个 epoch，使用 2.x 执行 10 个
如果我将它切换到 Python 2.x，它执行 10。这是为什么？训练逻辑回归模型 import keras.backend as
JavaScript 执行
我有两个脚本，它们包含在 HTML 正文中。在第一个脚本中，我初始化一个 JS 对象，该对象在第二个脚本标记中引用。 ... obj.a = 1000; obj.
执行@number时的Java链接列表错误消息
每当我运行该方法时，我都会收到一个带有数字的错误以下是我的代码。 public String getAccount() { String s = "Listing the accounts";
java - 执行 while 循环以显示菜单
我已经用 do~while(true) 创建了我的菜单；但是每次用户输入一个数字时，它不会运行程序，而是再次显示菜单!你怎么看？ //我的主要方法 public static void main(St
ipython - 执行/命令完成时通知
执行命令后，如何让IPython通知我？我可以使用铃声/警报还是通过弹出窗口获取它？我正在OS X 10.8.5的iTerm上运行Anaconda。最佳答案使用最新版本的iTerm，您可以在she
java - Swing 执行
您好，我刚刚使用菜单栏为 Swing 编写了代码。但是问题出现在运行中。我输入: javac Menu.java java Menu 它没有给出任何错误，但 GUI 没有显示。这是我的源代码以供引用:
.net - 执行.NET应用程序时验证Authenticode签名
我觉得这里缺少明显的东西，但是我看不到它写在任何地方。我使用Authenticode证书对可执行文件进行签名，但是当我开始学习有关它的更多信息时，我对原样的值(value)提出了质疑。签名的exe
按钮单击事件上的 JavaScript 执行
我正在设计一个应用程序，它使用 DataTables 中的预定义库来创建数据表。我想对数据表执行删除操作，为此应在按钮单击事件上执行 java 脚本。 $(document).ready(functi
Haskell - 执行 while 循环
我是 Haskell 新手，如果有人愿意帮助我，我会很高兴!我试图让这个程序与 do while 循环一起工作。第二个 getLine 命令的结果被放入变量 goGlenn 中，如果 goGlenn
java - 执行 while 循环时出现问题
我有一个用 swing 实现迷你游戏的程序，在主类中我有一个循环，用于监听游戏 map 中的 boolean 值。使用 while 实现的循环不会执行一条指令，如果它是唯一的一条指令，我不知道为什么。
java - 执行.jar时将OJBDC添加到类路径
我正在尝试开发一个连接到 Oracle 数据库并执行函数的 Java 应用程序。如果我在 Eclipse 中运行该应用程序，它可以工作，但是当我尝试在 Windows 命令提示符中运行 .jar 时，
java future 执行
我正在阅读有关 Java 中的 Future 和 javascript 中的 Promises 的内容。下面是我作为示例编写的代码。我的问题是分配给 future 的任务什么时候开始执行？当如下行创
java - 执行 && 最有效的方法？
我有一个常见的情况，您有两个变量(xSpeed 和 ySpeed)，当它们低于 minSpeed 时，我想将它们独立设置为零，并在它们都为零时退出。最有效的方法是什么？目前我有两种方法(方法2更干净

首页

博学

6Ren·AI

商城

c# - 将单线程应用程序迁移到多线程、并行执行、蒙特卡洛模拟