gpt4 book ai didi

perl - 如何随机采样文件的内容?

转载 作者:行者123 更新时间:2023-12-01 05:05:53 24 4
gpt4 key购买 nike

我有一个包含内容的文件

abc
def
high
lmn
...
...

文件中有超过 200 万行。
我想从文件中随机采样行并输出 50K 行。关于如何解决这个问题的任何想法?我在思考 Perl 及其 rand函数(或者一个方便的 shell 命令会很整洁)。

相关(可能重复)问题:
  • Randomly Pick Lines From a File Without Slurping It With Unix
  • How can I get exactly n random lines from a file with Perl?
  • 最佳答案

    假设您基本上想要输出所有行的 2.5%,这将执行以下操作:

    print if 0.025 > rand while <$input>;

    关于perl - 如何随机采样文件的内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1034800/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com