gpt4 book ai didi

windows - Powershell 使用指定的输入数据创建大型文件

转载 作者:行者123 更新时间:2023-12-03 11:06:04 26 4
gpt4 key购买 nike

我正在尝试确定什么 Powershell 命令等同于以下 Linux 命令,用于在合理的时间内创建具有精确大小并填充给定文本输入的大文件。

给定:

$ cat line.txt
!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~ZZZZ

$ time yes `cat line.txt` | head -c 10GB > file.txt # create large file
real 0m59.741s

$ ls -lt file.txt
-rw-r--r--+ 1 k None 10000000000 Feb 2 16:28 file.txt

$ head -3 file.txt
!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~ZZZZ
!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~ZZZZ
!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~ZZZZ

什么是最有效、最紧凑的 Powershell 命令,它允许我指定大小、文本内容并像上面的 Linux 命令一样创建文件?谢谢! Original ask here was automatically closed for some reason

最佳答案

没有与您的命令直接等效的 PowerShell。

事实上,对于这种大小的文件,您最好的选择是避免使用 PowerShell 自己的 cmdlet 和管道,而是直接使用 .NET 类型:

& {
param($outFile, $size, $content)

# Add a newline to the input string, if needed.
$line = $content + "`n"

# Calculate how often the line must be repeated (including trailing newline)
# to reach the target size.
[long] $remainder = 0
$iterations = [math]::DivRem($size, $line.Length, [ref] $remainder)

# Create the output file.
$outFileInfo = New-Item -Force $outFile
$fs = [System.IO.StreamWriter] $outFileInfo.FullName

# Fill it with duplicates of the line.
foreach ($i in 1..$iterations) {
$fs.Write($line)
}

# If a partial line is needed to reach the exact target size, write it now.
if ($remainder) {
$fs.Write($line.Substring(0, $remainder))
}

$fs.Close()

} file.txt 1e10 (Get-Content line.txt)

注:1e10使用 PowerShell 对科学记数法的支持作为 10000000000 的简写( 10,000,000,000 ,即 [Math]::Pow(10, 10 )。请注意,PowerShell 还内置了对字节乘数 后缀 的支持 - kb , mb , gbtb - 但它们是二进制 乘数,因此 10gb相当于10,737,418,240 ( 10 * [math]::Pow(1024, 3) ),不是十进制 10,000,000,000 .

注意:

  • 传递的大小(在本例中为 1e10)是字符 计数,而不是字节 计数。鉴于 .NET 的文件 I/O API 默认使用无 BOM 的 UTF-8 编码,只有当您限制输入字符串填充文件为 ASCII 范围内的字符(代码点 0x0 - 0x7f)时,这两个计数才会相等。 ).

  • 如果总字符数不是输入字符串长度 + 1(用于换行)。

  • 通过写入 bytes 和输出缓冲的组合,可以将此代码的性能优化高达 20%,如 zett42's helpful answer 所示。 .

按照 PowerShell 标准,上述表现相当不错。

一般来说,PowerShell 的面向对象特性永远无法与原生 Unix 实用程序/shell 提供的原始字节处理速度相提并论。

把上面的代码变成一个可重用的函数并不难;在
简而言之,替换 & { ... }用类似 function New-FileOfSize { ... } 的东西并调用New-FileOfSize file.txt 1gb (Get-Content line.txt) - 查看概念 about_Functions帮助主题和 about_Functions_Advanced了解如何使功能更复杂。

关于windows - Powershell 使用指定的输入数据创建大型文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66019720/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com