gpt4 book ai didi

perl - 并行处理多个文件

转载 作者:行者123 更新时间:2023-12-04 05:32:43 35 4
gpt4 key购买 nike

我有一个 Perl 脚本,它读取两个文件并处理它们。

第一个文件 - 信息文件 - 我将它存储为哈希(3.5 GB)

第二个文件 - taregt 文件 - 我正在使用信息文件和其他设计的子例程中的信息进行处理。 (此文件,目标,范围为 30 - 60 GB)

到目前为止的工作是:

  • 将信息文件读入哈希
  • 将目标文件分解为
    大块

  • 我想在所有块上并行运行:
    while(chunks){
    # do something

    sub a {}
    sub b {}
    }

    所以基本上,我想读取一个块,写入它的输出并同时为多个块执行此操作。 while 循环读取块文件的每一行,并调用各种子程序进行处理。

    有没有办法可以在后台读取块?

    我不想读取每个块的信息文件,因为它长 3.5gb,我正在将它读入哈希,每次占用 3.5gb。

    现在脚本需要 1 - 2 小时才能运行 30-60GB。

    最佳答案

    您可以尝试使用 Perl threads如果并行任务是独立的。

    关于perl - 并行处理多个文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12375030/

    35 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com