- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在使用一个复杂的外部库,我试图在其中对大量项目执行它的功能。该库没有公开良好的异步接口(interface),所以我只能使用一些非常老式的代码。
我的目标是优化完成一批处理所需的时间,并在不包含实际的第 3 方库的情况下演示问题我已经创建了下面问题的近似值
给定一个非异步操作,您可以提前知道操作的“大小”(即复杂性):
public interface IAction
{
int Size { get; }
void Execute();
}
鉴于此操作有 3 个变体:
public class LongAction : IAction
{
public int Size => 10000;
public void Execute()
{
Thread.Sleep(10000);
}
}
public class MediumAction : IAction
{
public int Size => 1000;
public void Execute()
{
Thread.Sleep(1000);
}
}
public class ShortAction : IAction
{
public int Size => 100;
public void Execute()
{
Thread.Sleep(100);
}
}
您如何优化一长串这些操作,以便在以某种并行方式运行时,整个批处理尽快完成?
天真地,您可以将整个批处理都扔到一个 Parallel.ForEach
中,具有相当高的并行度,这当然有效 - 但必须有一种方法来优化它们,以便一些最大的首先开始。
为了进一步说明问题,如果我们举一个 super 简化的例子
还有 2 个可用线程。我可以想出 2 种(很多)方法来安排这些任务(黑条是死时间 - 没有什么可安排的):
很明显,第一个比第二个完成得早。
完整的测试代码,如果有人喜欢 bash(尝试让它比我下面的天真实现更快):
class Program
{
static void Main(string[] args)
{
MainAsync().GetAwaiter().GetResult();
Console.ReadLine();
}
static async Task MainAsync()
{
var list = new List<IAction>();
for (var i = 0; i < 200; i++) list.Add(new LongAction());
for (var i = 0; i < 200; i++) list.Add(new MediumAction());
for (var i = 0; i < 200; i++) list.Add(new ShortAction());
var swSync = Stopwatch.StartNew();
Parallel.ForEach(list, new ParallelOptions { MaxDegreeOfParallelism = 20 }, action =>
{
Console.WriteLine($"{DateTime.Now:HH:mm:ss}: Starting action {action.GetType().Name} on thread {Thread.CurrentThread.ManagedThreadId}");
var sw = Stopwatch.StartNew();
action.Execute();
sw.Stop();
Console.WriteLine($"{DateTime.Now:HH:mm:ss}: Finished action {action.GetType().Name} in {sw.ElapsedMilliseconds}ms on thread {Thread.CurrentThread.ManagedThreadId}");
});
swSync.Stop();
Console.WriteLine($"Done in {swSync.ElapsedMilliseconds}ms");
}
}
public interface IAction
{
int Size { get; }
void Execute();
}
public class LongAction : IAction
{
public int Size => 10000;
public void Execute()
{
Thread.Sleep(10000);
}
}
public class MediumAction : IAction
{
public int Size => 1000;
public void Execute()
{
Thread.Sleep(1000);
}
}
public class ShortAction : IAction
{
public int Size => 100;
public void Execute()
{
Thread.Sleep(100);
}
}
最佳答案
一个相对快速和肮脏的解决方案是使用 a load-balancing partitioner在按大小递减排序的 Action 列表之上
var sorted = list.OrderByDescending(a => a.Size).ToArray();
var partitioner=Partitioner.Create(sorted, loadBalance:true);
Parallel.ForEach(partitioner, options, action =>...);
与其他答案一样,仅使用这两行,性能就提高了约 30%。
PLINQ 对数据进行分区,并使用单独的任务一次处理整个分区。当输入大小已知时,就像 IList 派生数组和列表的情况一样,输入被分成大小相等的 block 并提供给每个工作任务。
当大小未知时,如迭代器方法、LINQ 查询等,PLINQ 使用 block 分区。一次检索一大块数据并将其提供给工作任务。
我忘记的另一个选项是在 top chunck 分区上的负载平衡。这将使用小块的 block 分区应用于数组和 IList 派生的输入。负载均衡Partitioner.Create重载返回 OrderablePartitioner 实例,因此 IAction 项的顺序得以保留
同样可以用 IEnumerable<T>
来实现通过指定 EnumerablePartitionerOptions.NoBuffering
来源选项:
var sorted = list.OrderByDescending(a => a.Size);
var partitioner=Partitioner.Create(sorted,EnumerablePartitionerOptions.NoBuffering);
这将创建一个使用 block 编码的 OrderablePartitioner
关于c# - 并行长时间运行任务的时间优化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54091724/
我有一个独立的 Thread 应用程序。这是一个等待消息的监听器,当消息到达时执行一些操作,其中我必须将消息保存在数据库中。但我遇到了问题,因为如果我运行应用程序并“手动发送消息”,一切都会正常工作,
我有以下php代码: sleep(65); $query = "UPDATE database.table SET XXXXXXX = XXXXXXX - ".$YYYYYY." WHERE
我正在开发一个业余爱好应用程序。它在主布局中使用 webview。单击 webview 内的链接会使用户保持在 webview 内。启动后一切正常,但仍在应用程序内。但是,在手机休眠一段时间后,我重新
我目前运行的应用程序需要最大堆大小为 16GB。 目前我使用以下标志来处理垃圾回收。 -XX\:+UseParNewGC, -XX\:+UseConcMarkSweepGC, -XX:CMSIniti
$ uname -a Darwin Wheelie-Cyberman 10.8.0 Darwin Kernel Version 10.8.0: Tue Jun 7 16:33:36 PDT 2011
在 while 循环仍在休眠时退出它的最简单方法是什么?是否有某种函数可以在 sleep 时检测某个值是否为真? 或者我是否在循环中设置一个小 sleep 并检查如果不再睡一会儿就退出?如果可以,我该
我正在 Ubunu 的 Jetty 6 上运行 Java Web 服务器,用于基于反向 ajax 的 Web。而且我在向浏览器重新发送数据的线程滞后方面遇到了严重的问题。很多时候,一些线程开始 hib
当我运行长时间操作时,我遇到来自 IIS 的请求超时。我的 ASP.NET 应用程序正在后台处理数据,但处理的记录数量很大,因此操作需要很长时间。 但是,我认为 IIS 使 session 超时。这是
我不确定从哪里开始解决这个问题,但如果我有一个 AJAX 网络应用程序向服务器发送请求并在数据库(在我的例子中是 postgresql)上运行长查询,有没有办法停止或如果仍在运行时用户刷新页面或关闭
我是一名优秀的程序员,十分优秀!