gpt4 book ai didi

c# - 如何使用 C# 和并行扩展并行化顺序任务?

转载 作者:行者123 更新时间:2023-11-30 16:29:43 25 4
gpt4 key购买 nike

我有以下顺序调用的方法:

  1. 私有(private) StringBuilder ReadPDF();
  2. 私有(private) StringBuilder CleanText(StringBuilder sb);
  3. 私有(private)无效 ParseText();

ParseText 调用调用 CleanText 的 ReadPDF;

我正在解析的 PDF 有 15MB 的文本,使用常规的 core 2 双核计算机从文件中提取所有数据需要 10 分钟。

如何并行执行这些任务?

编辑:澄清一下,阅读 PDF 只需要很少的时间,问题在于解析提取的文本,更具体地说是在 CleanText 阶段。我需要并行化的原因是清理单个页面是即时的,但清理 2k+ 页面需要很长时间。

最佳答案

首先,您可能需要回顾一下您阅读 PDF 的方式。如果它只有 15MB,那么阅读它不会花费 10 分钟,除非您使用某种非常非常糟糕的解析方式。其次,在你找到更好的解析方式之后,你应该确保你可以从你需要的任何页面一次读取一个页面。之后,您将能够并行运行读取单个页面的多个任务。

关于c# - 如何使用 C# 和并行扩展并行化顺序任务?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6154495/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com