- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我想并行处理逐帧处理多个视频剪辑的应用程序。每个剪辑的每个帧的顺序很重要(显然)。我决定使用 TPL 数据流,因为我相信这是数据流的一个很好的例子(电影帧就是数据)。
所以我有一个从数据库加载帧的进程(比如说一批 500 个,全部聚在一起)
Example sequence:
|mid:1 fr:1|mid:1 fr:2|mid:2 fr:1|mid:3 fr:1|mid:1 fr:3|mid:2 fr:2|mid:2 fr:3|mid:1 fr:4|
并将它们发布到 BufferBlock。对于这个 BufferBlock,我将 ActionBlocks 与过滤器链接起来,使每个 MovieID 有一个 ActionBlock,这样我就可以进行某种数据分区。每个 ActionBlock 都是顺序的,但理想情况下,多部电影的多个 ActionBlock 可以并行运行。
我确实让上述网络工作并且它确实并行运行,但根据我的计算,只有八到十个 ActionBlocks 在同时执行。我对每个 ActionBlock 的运行时间进行了计时,大约为 100-200 毫秒。我可以采取哪些步骤至少使并发性翻倍?
我曾尝试将 Action 委托(delegate)转换为异步方法,并在 ActionBlock Action 委托(delegate)中使数据库访问异步,但没有帮助。
编辑:我实现了额外级别的数据分区:奇数 ID 电影的帧在 ServerA 上处理,偶数电影的帧在 ServerB 上处理。应用程序的两个实例都访问同一个数据库。如果我的问题是 DB IO,那么我不会看到处理的总帧数有任何改善(或者非常小,低于 20%)。但我确实看到它翻了一番。因此,这让我得出结论,Threadpool 并没有产生更多的线程来并行处理更多的帧(两台服务器都是四核的,分析器显示每个应用程序大约有 25-30 个线程)。
最佳答案
一些假设:
根据您的示例数据,您收到的电影帧(可能还有电影中的帧)乱序
您的 ActionBlock<T>
实例是通用的;它们都调用相同的方法进行处理,您只需根据每个电影 ID 创建它们的列表(您事先有一个电影 ID 列表),如下所示:
// The movie IDs
IEnumerable<int> movieIds = ...;
// The actions.
var actions = movieIds.Select(
i => new { Id = i, Action = new ActionBlock<Frame>(MethodToProcessFrame) });
// The buffer block.
BufferBlock<Frame> buffer = ...;
// Link everything up.
foreach (var action in actions)
{
// Not necessary in C# 5.0, but still, good practice.
// The copy of the action.
var actionCopy = action;
// Link.
bufferBlock.LinkTo(actionCopy.Action, f => f.MovieId == actionCopy.Id);
}
如果是这种情况,则说明您创建了太多 ActionBlock<T>
没有被赋予工作的实例;因为你的帧(和可能的电影)是乱序的,你不能保证所有的 ActionBlock<T>
实例将有工作要做。
此外,当您创建 ActionBlock<T>
实例它将使用 MaxDegreeOfParallelism
创建为 1,这意味着它是线程安全的,因为只有一个线程可以同时访问该 block 。
此外,TPL DataFlow 库最终依赖于 Task<TResult>
class ,它默认在线程池上进行调度。线程池将在这里做一些事情:
确保所有处理器核心都饱和。这与确保您的 ActionBlock<T>
非常不同实例已经饱和,这个是您应该关注的指标
确保在处理器内核饱和时,确保工作均匀分布,并确保没有太多正在执行的并发任务(上下文切换很昂贵).
看起来你处理电影的方法是通用的,传入什么电影的帧并不重要(如果它确实重要,那么你需要更新你的问题有了它,因为它改变了很多东西)。这也意味着它是线程安全的。
此外,如果可以假设一帧的处理不依赖于任何先前帧的处理(或者,看起来电影的帧是按顺序排列的),您可以使用单个 ActionBlock<T>
但调整 MaxDegreeOfParallelism
值,像这样:
// The buffer block.
BufferBlock<Frame> buffer = ...;
// Have *one* ActionBlock<T>
var action = new ActionBlock<Frame>(MethodToProcessFrame,
// This is where you tweak the concurrency:
new ExecutionDataflowBlockOptions {
MaxDegreeOfParallelism = 4,
}
);
// Link. No filter needed.
bufferBlock.LinkTo(action);
现在,您的 ActionBlock<T>
将总是饱和。诚然,任何负责任的任务调度程序(默认情况下是线程池)仍然会限制最大并发量,但它会在同一时间合理地做尽可能多的事情。
为此,如果您的操作是真正线程安全的,您可以设置 MaxDegreeOfParallelism
至 DataflowBlockOptions.Unbounded
,像这样:
// Have *one* ActionBlock<T>
var action = new ActionBlock<Frame>(MethodToProcessFrame,
// This is where you tweak the concurrency:
new ExecutionDataflowBlockOptions {
// We're thread-safe, let the scheduler determine
// how nuts we can go.
MaxDegreeOfParallelism = DataflowBlockOptions.Unbounded,
}
);
当然,所有这些都假设其他一切都是最优的(I/O 读/写等)
关于c# - 长时间运行的进程的并行化和性能优化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13383450/
我是 Linux 的新手,并且继承了保持我们的单一 Linux 服务器运行的职责。这是我们的SVN服务器,所以比较重要。 原来在我之前维护它的人有一个 cron 任务,当有太多 svnserve 进程
Node 虽然自身存在多个线程,但是运行在 v8 上的 JavaScript 是单线程的。Node 的 child_process 模块用于创建子进程,我们可以通过子进程充分利用 CPU。范例:
Jenkins 有这么多进程处于事件状态是否正常? 我检查了我的设置,我只配置了 2 个“执行者”... htop http://d.pr/i/RZzG+ 最佳答案 您不仅要限制 Master 中的执
我正在尝试在 scala 中运行这样的 bash 命令: cat "example file.txt" | grep abc Scala 有一个特殊的流程管道语法,所以这是我的第一个方法: val f
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我需要一些帮助来理解并发编程的基础知识。事实上,我读得越多,就越感到困惑。因此,我理解进程是顺序执行的程序的一个实例,并且它可以由一个或多个线程组成。在单核CPU中,一次只能执行一个线程,而在多核CP
我的问题是在上一次集成测试后服务器进程没有关闭。 在integration.rs中,我有: lazy_static! { static ref SERVER: Arc> = {
我正在使用 Scala scala.sys.process图书馆。 我知道我可以用 ! 捕获退出代码和输出 !!但是如果我想同时捕获两者呢? 我看过这个答案 https://stackoverflow
我正在开发一个C++类(MyClass.cpp),将其编译为动态共享库(MyClass.so)。 同一台Linux计算机上运行的两个不同应用程序将使用此共享库。 它们是两个不同的应用程序。它不是多线程
我在我的 C 程序中使用 recvfrom() 从多个客户端接收 UDP 数据包,这些客户端可以使用自定义用户名登录。一旦他们登录,我希望他们的用户名与唯一的客户端进程配对,这样服务器就可以通过数据包
如何更改程序,以便函数 function_delayed_1 和 function_delayed_2 仅同时执行一次: int main(int argc, char *argv[]) {
考虑这两个程序: //in #define MAX 50 int main(int argc, char* argv[]) { int *count; int fd=shm
请告诉我如何一次打开三个终端,这样我的项目就可以轻松执行,而不必打开三个终端三次然后运行三个exe文件。请问我们如何通过脚本来做到这一点,即打开三个终端并执行三个 exe 文件。 最佳答案 在后台运行
我编写了一个监控服务来跟踪一组进程,并在服务行为异常、内存使用率高、超出 CPU 运行时间等时发出通知。 这在我的本地计算机上运行良好,但我需要它指向远程机器并获取这些机器上的进程信息。 我的方法,在
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 8年前关闭。 Improve this qu
我有一个允许用户上传文件的应用程序。上传完成后,必须在服务器上完成许多处理步骤(解压、存储、验证等...),因此稍后会在一切完成后通过电子邮件通知用户。 我见过很多示例,其中 System.Compo
这个问题对很多人来说可能听起来很愚蠢,但我想对这个话题有一个清晰的理解。例如:当我们在 linux(ubuntu, x86) 上构建一个 C 程序时,它会在成功编译和链接过程后生成 a.out。 a.
ps -eaf | grep java 命令在这里不是识别进程是否是 java 进程的解决方案,因为执行此命令后我的许多 java 进程未在输出中列出。 最佳答案 简答(希望有人写一个更全面的): 获
我有几个与内核态和用户态的 Windows 进程相关的问题。 如果我有一个 hello world 应用程序和一个暴露新系统调用 foo() 的 hello world 驱动程序,我很好奇在内核模式下
我找不到很多关于 Windows 中不受信任的完整性级别的信息,对此有一些疑问: 是否有不受信任的完整性级别进程可以创建命名对象的地方? (互斥锁、事件等) 不受信任的完整性级别进程是否应该能够打开一
我是一名优秀的程序员,十分优秀!