- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我的任务是采用现有的单线程蒙特卡洛模拟并优化它。这是一个 c# 控制台应用程序,没有数据库访问,它从 csv 文件加载一次数据并在最后写出,所以它几乎只是 CPU 限制,也只使用大约 50mb 的内存。
我已经通过 Jetbrains dotTrace 分析器运行它。在总执行时间中,大约 30% 用于生成均匀随机数,24% 用于将均匀随机数转换为正态分布随机数。
基本的算法是一大堆嵌套的for循环,中间是随机数调用和矩阵乘法,每次迭代返回一个double,它被添加到一个结果列表中,这个列表是周期性的对某些收敛标准进行排序和测试(在检查点,每 5% 的总迭代次数)如果可接受,程序将跳出循环并写入结果,否则它会继续到最后。
我希望开发人员能够权衡:
上面的一些教程链接将是最受欢迎的,因为我从未编写过任何并行或多线程代码。
当前应用需要 2 小时完成 500,000 次迭代,业务需要将其扩展到 3,000,000 次迭代并每天被调用多次,因此需要进行一些重大优化。
特别想听听使用过 Microsoft Parallels Extension 或 AForge.Net Parallel 的人的意见
这需要相当快地进行生产,所以 .net 4 beta 已经发布,尽管我知道它内置了并发库,我们可以考虑在它发布后迁移到 .net 4释放。目前服务器有 .Net 2,我已经提交了我的开发箱有的 .net 3.5 SP1 升级以供审查。
谢谢
更新
我刚刚尝试了 Parallel.For 实现,但它得出了一些奇怪的结果。单线程:
IRandomGenerator rnd = new MersenneTwister();
IDistribution dist = new DiscreteNormalDistribution(discreteNormalDistributionSize);
List<double> results = new List<double>();
for (int i = 0; i < CHECKPOINTS; i++)
{
results.AddRange(Oblist.Simulate(rnd, dist, n));
}
收件人:
Parallel.For(0, CHECKPOINTS, i =>
{
results.AddRange(Oblist.Simulate(rnd, dist, n));
});
在模拟中有很多对 rnd.nextUniform() 的调用,我想我得到很多相同的值,这是否可能发生,因为现在是并行的?
也可能是 List AddRange 调用不是线程安全的问题?我看到了这个
System.Threading.Collections.BlockingCollection 可能值得使用,但它只有一个没有 AddRange 的 Add 方法,所以我必须查看那里的结果并以线程安全的方式添加。来自使用过 Parallel.For 的人的任何见解,非常感谢。我暂时切换到 System.Random 进行调用,因为在使用我的 Mersenne Twister 实现调用 nextUniform 时出现异常,可能它不是线程安全的某个数组得到一个索引越界....
最佳答案
首先,您需要了解为什么您认为使用多线程是一种优化——但实际上并非如此。如果您有多个处理器,那么使用多线程将使您的工作负载完成得更快只有,并且最多比您有可用的 CPU 快很多倍(这称为加速).在传统意义上,工作并未“优化”(即工作量并未减少 - 事实上,对于多线程,由于线程开销,工作总量通常会增加)。
因此,在设计您的应用程序时,您必须找到可以并行或重叠方式完成的部分工作。可以并行生成随机数(通过在不同的 CPU 上运行多个 RNG),但这也会改变结果,因为您会得到不同的随机数。另一种选择是在一个 CPU 上生成随机数,而在不同的 CPU 上生成其他所有内容。这可为您提供最大 3 倍的加速,因为 RNG 仍将按顺序运行,并且仍会占用 30% 的负载。
因此,如果您进行这种并行化,最终会得到 3 个线程:线程 1 运行 RNG,线程 2 生成正态分布,线程 3 执行其余的模拟。
对于这个架构,一个producer-consumer architecture是最合适的。每个线程将从队列中读取其输入,并将其输出生成到另一个队列中。每个队列都应该是阻塞的,因此如果 RNG 线程落后,归一化线程将自动阻塞,直到有新的随机数可用。为了提高效率,我会跨线程传递 100(或更大)数组中的随机数,以避免对每个随机数进行同步。
对于这种方法,您不需要任何高级线程。只使用常规线程类,没有池,没有库。您唯一需要的(不幸的是)不在标准库中的是阻塞队列类(System.Collections 中的队列类不好)。 Codeproject提供一个看起来合理的实现;可能还有其他人。
关于c# - 将单线程应用程序迁移到多线程、并行执行、蒙特卡洛模拟,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1116604/
我有一个“有趣”的问题,即以两种不同的方式运行 wine 会导致: $> wine --version /Applications/Wine.app/Contents/Resources/bin/wi
我制作了这个网络抓取工具来获取网页中的表格。我使用 puppeteer (不知道 crontab 有问题)、Python 进行清理并处理数据库的输出 但令我惊讶的是,当我执行它时 */50 * * *
JavaScript 是否被调用或执行取决于什么?准确地说,我有两个函数,它们都以相同的方式调用: [self.mapView stringByEvaluatingJavaScriptFromStri
我目前正在使用 python 做一个机器学习项目(这里是初学者,从头开始学习一切)。 只是想知道 statsmodels 的 OLS 和 scikit 的 PooledOlS 使用我拥有的相同面板数据
在使用集成对象模型 (IOM) 后,我可以执行 SAS 代码并将 SAS 数据集读入 .Net/C# 数据集 here . 只是好奇,使用 .Net 作为 SAS 服务器的客户端与使用 Enterpr
有一些直接的 jQuery 在单击时隐藏打开的 div 未显示,但仍将高度添加到导航中以使其看起来好像要掉下来了。 这个脚本工作正常: $(document).ready(funct
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 4 年前。 这里是 Java 新手,我正在使用 NetBeans 尝试一些简单的代
如果我将它切换到 Python 2.x,它执行 10。这是为什么? 训练逻辑回归模型 import keras.backend as
我有两个脚本,它们包含在 HTML 正文中。在第一个脚本中,我初始化一个 JS 对象,该对象在第二个脚本标记中引用。 ... obj.a = 1000; obj.
每当我运行该方法时,我都会收到一个带有数字的错误 以下是我的代码。 public String getAccount() { String s = "Listing the accounts";
我已经用 do~while(true) 创建了我的菜单;但是每次用户输入一个数字时,它不会运行程序,而是再次显示菜单!你怎么看? //我的主要方法 public static void main(St
执行命令后,如何让IPython通知我?我可以使用铃声/警报还是通过弹出窗口获取它?我正在OS X 10.8.5的iTerm上运行Anaconda。 最佳答案 使用最新版本的iTerm,您可以在she
您好,我刚刚使用菜单栏为 Swing 编写了代码。但是问题出现在运行中。我输入: javac Menu.java java Menu 它没有给出任何错误,但 GUI 没有显示。这是我的源代码以供引用:
我觉得这里缺少明显的东西,但是我看不到它写在任何地方。 我使用Authenticode证书对可执行文件进行签名,但是当我开始学习有关它的更多信息时,我对原样的值(value)提出了质疑。 签名的exe
我正在设计一个应用程序,它使用 DataTables 中的预定义库来创建数据表。我想对数据表执行删除操作,为此应在按钮单击事件上执行 java 脚本。 $(document).ready(functi
我是 Haskell 新手,如果有人愿意帮助我,我会很高兴!我试图让这个程序与 do while 循环一起工作。 第二个 getLine 命令的结果被放入变量 goGlenn 中,如果 goGlenn
我有一个用 swing 实现迷你游戏的程序,在主类中我有一个循环,用于监听游戏 map 中的 boolean 值。使用 while 实现的循环不会执行一条指令,如果它是唯一的一条指令,我不知道为什么。
我正在尝试开发一个连接到 Oracle 数据库并执行函数的 Java 应用程序。如果我在 Eclipse 中运行该应用程序,它可以工作,但是当我尝试在 Windows 命令提示符中运行 .jar 时,
我正在阅读有关 Java 中的 Future 和 javascript 中的 Promises 的内容。下面是我作为示例编写的代码。我的问题是分配给 future 的任务什么时候开始执行? 当如下行创
我有一个常见的情况,您有两个变量(xSpeed 和 ySpeed),当它们低于 minSpeed 时,我想将它们独立设置为零,并在它们都为零时退出。 最有效的方法是什么?目前我有两种方法(方法2更干净
我是一名优秀的程序员,十分优秀!