gpt4 book ai didi

powershell - 如何更改我的 Powershell 脚本,以便它以 ANSI-Windows-1252 编码写入输出文件?

转载 作者:行者123 更新时间:2023-12-04 01:00:48 24 4
gpt4 key购买 nike

我有一个银行应用程序脚本,它通过从日常输入银行文件中删除错误记录来生成“过滤”输出文件(请参阅 How do I create a Windows Server script to remove error records, AND the previous record to each, from a file with the results written to a NEW file )。 “过滤后的”输出文件将被发送到国家以更新他们的系统。作为旁注,我们从银行收到的原始输入文件在我的文件编辑器 (UltraEdit) 中显示为 Unix 1252 (ANSI Latin 1),并且每条记录仅以换行结束。

我将几个由“干净”(无错误)和“脏”(包含 4 个错误)输入文件生成的测试输出文件发送到 State 进行测试,以确保在实现前一切正常,但有点担心是因为输出文件是以 CRLF 行结尾的 UTF-16 编码生成的,其中输入和当前未过滤的输出是在 Windows-1252 中编码的。此系统上的所有其他输出文件都是 Windows-1252 编码的。

果然......我得到消息说编码对于国家系统是不正确的。他们的评论是:
“该文件采用 UCS-2 Little Endian 编码,需要转换为 ANSI 才能在我们的系统上运行。这是出乎意料的。

之后,没有详细交易的文件将通过我们的 EFT 拒绝程序运行。

看起来处理得还可以,但我们不得不做一些转换。可以用 ANSI 发送还是需要用 UCS 2 Little Endian 发送?”

我曾尝试将 –Encoding “Windows-1252” 和 –Encoding windows-1252 添加到我的输出文件语句中,但未成功,两者都返回消息:
输出文件:无法验证参数“编码”上的参数。论据
“Windows-1252”不属于集合
“未知,字符串,unicode,bigendianunicode,utf8,utf7,utf32,ascii,默认,oem”
由 ValidateSet 属性指定。提供集合中的参数
然后再次尝试该命令。
在 C:\EZTRIEVE\PwrShell\TEST2_FilterR02.ps1:47 char:57
+ ... 输出字符串 | Out-File $OutputFileFiltered -Encoding "Windows-1252"
+ ~~~~~~~~~~~~~~
+ CategoryInfo : InvalidData: (:) [Out-File], ParameterBindingVal
idationException
+ FullQualifiedErrorId : ParameterArgumentValidationError,Microsoft.Power
Shell.Commands.OutFileCommand

几天来我一直在寻找一些帮助,但没有什么是真正清楚的,而且我发现的绝大多数内容都涉及从 Windows-1252 转换为另一种编码。昨天,我在 stackoverflow 上的某处发现了一条评论,说“ANSI”与 Windows-1252 相同,但到目前为止,我还没有找到任何内容告诉我如何将 Windows-1252 编码选项正确附加到我的输出文件语句中Powershell 会接受它。我真的需要完成这个项目,这样我才能处理接下来添加到我的队列中的几个项目。是否可能缺少一个需要附加到 –Encoding 的子参数?

这是在运行 Windows Server 2016 Standard 和 Powershell 5.1 的新备份服务器上在 Dollar Universe(作业调度程序)下进行测试的。我们的生产系统在 Windows Server 2012 R2 上运行 Dollar Universe,也使用 Powershell 5.1(是的,我们正在寻找足够的升级窗口 :-)

在我上次尝试时,我的 Powershell 脚本是:

 [cmdletbinding()]
Param
(
[string] $InputFilePath
)

# Read the text file
$InputFile = Get-Content $InputFilePath

# Initialize output record counter
$Inrecs = 0
$Outrecs = 0

# Get the time
$Time = Get-Date -Format "MM_dd_yy"

# Set up the output file name
$OutputFileFiltered = "C:\EZTRIEVE\CFIS\DATA\TEST_CFI_EFT_RETURN_FILTERED"

# Initialize the variable used to hold the output
$OutputStrings = @()

# Loop through each line in the file
# Check the line ahead for "R02" and add it to the output
# or skip it appropriately
for ($i = 0; $i -lt $InputFile.Length - 1; $i++)
{
if ($InputFile[$i + 1] -notmatch "R02")
{
# The next record does not contain "R02", increment count and add it to the output
$Outrecs++
$OutputStrings += $InputFile[$i]
}
else
{
# The next record does contain "R02", skip it
$i++
}
}

# Add the trailer record to the output
$OutputString += $InputFile[$InputFile.Length - 1]

# Write the output to a file
# $OutputStrings | Out-File $OutputFileFiltered
$OutputStrings | Out-File $OutputFileFiltered -Encoding windows-1252

# Display record processing stats:

$Filtered = $Outrecs-$i

Write-Host $i Input records processed

Write-Host $Filtered Error records filtered out

Write-Host $Outrecs Output records written

最佳答案

笔记:

  • 您后来澄清说您需要 LF(Unix 风格)换行符 - 请参阅底部部分。
  • 下一节将处理最初提出的问题,并提供导致文件带有 CRLF(Windows 样式)换行符(在 Windows 上运行时)的解决方案。

  • 如果您的系统的 Language for non-Unicode programs setting(又名系统区域设置)恰好将 Windows-1252 作为事件的 ANSI 代码页 (例如,在美国-英语或西欧系统上),则 使用 -Encoding Default ,因为 Default 指的是 Windows 中的代码页PowerShell (但不在 PowerShell Core 中,它默认为无 BOM 的 UTF-8 并且不支持 Default 编码标识符)。
    验证: (Get-ItemPropertyValue HKLM:\SYSTEM\CurrentControlSet\Control\Nls\CodePage ACP) -eq '1252'
    ... | Out-File -Encoding Default $file
    笔记:
  • 如果您确定您的数据实际上仅由 ASCII 范围字符(代码点在 7 位范围内的字符,不包括重音字符,如 ü )组成,即使您的系统区域设置使用 ANSI 代码,-Encoding Default 也能工作考虑到所有(单字节)ANSI 代码页在其 7 位子范围内共享所有 ASCII 字符,而不是 Windows-1252 的页面;然后您也可以使用 -Encoding ASCII ,但请注意,如果毕竟存在非 ASCII 字符,它们将被音译为文字 ? 字符,从而导致信息丢失。
  • Set-Content cmdlet 实际上默认为 Windows PowerShell 中的 Default 编码(但不是 PowerShell Core,其中一致的默认值是没有 BOM 的 UTF-8)。
  • 虽然 Set-Content 的字符串化行为与 Out-File 的不同 - see this answer - 如果写入文件的对象已经是字符串,它实际上是更好的选择。

  • 否则 ,您有两个选择:
  • 直接使用 .NET Framework 文件 I/O 功能 ,您可以在其中使用 .NET 支持的任何编码;例如。:
      $lines = ...  # array of strings (to become lines in a file)
    # CAVEAT: Be sure to specify an *absolute file path* in $file,
    # because .NET typically has a different working dir.
    [IO.File]::WriteAllLines($file, $lines, [Text.Encoding]::GetEncoding(1252))
  • 使用 PowerShell Core ,它允许您将任何支持的 .NET 编码传递给 -Encoding 参数:
      ... | Out-File -Encoding ([Text.Encoding]::GetEncoding(1252)) $file

  • 请注意,在 PSv5.1+ 中,您实际上可以 更改 >>> 运算符 使用的编码,如 this answer 中所述。
    但是,在 Windows PowerShell 中,您再次受限于 Out-File-Encoding 参数支持的编码。

    在 Windows 上使用 LF(Unix 风格)换行符创建文本文件:
    PowerShell(总是)和 .NET(默认情况下)在将字符串作为行写入文件时使用适合平台的换行序列 - 如 [Environment]::NewLine 中所反射(reflect)的那样。
    换句话说:在 Windows 上,您最终会得到带有 CRLF 换行符的文件,而在类 Unix 平台(PowerShell Core)上会得到带有 LF 换行符的文件。
    请注意,下面的解决方案假设要写入文件的数据是一个字符串数组,这些字符串表示要写入的行,例如 Get-Content 返回的(其中生成的数组元素是输入文件的行,没有它们的尾随换行符序列) .
    要在 Windows ( PSv5+ ) 上显式创建带有 LF 换行符的文件:
    $lines = ...  # array of strings (to become lines in a file)

    ($lines -join "`n") + "`n" | Set-Content -NoNewline $file
    "`n" 产生一个 LF 字符。
    笔记:
  • 在 Windows PowerShell 中,这隐式使用事件 ANSI 代码页的编码。
  • 在 PowerShell Core 中,这会隐式创建一个没有 BOM 的 UTF-8 文件。如果要改用事件的 ANSI 代码页,请使用:
    -Encoding ([Text.Encoding]::GetEncoding([int] (Get-ItemPropertyValue HKLM:\SYSTEM\CurrentControlSet\Control\Nls\CodePage ACP)))

  • PSv4-(PowerShell 版本 4 或更低版本)中,您必须直接使用 .NET Framework:
    $lines = ...  # array of strings (to become lines in a file)


    # CAVEAT: Be sure to specify an *absolute file path* in $file,
    # because .NET typically has a different working dir.
    [IO.File]::WriteAllText($file, ($lines -join "`n") + "`n")
    笔记:
  • 在 Windows PowerShell 和 PowerShell Core 中,这将创建一个没有 BOM 的 UTF-8 文件。
  • 如果您想改用事件的 ANSI 代码页,请将以下内容作为附加参数传递给 WriteAllText() :
    ([Text.Encoding]::GetEncoding([int] (Get-ItemPropertyValue HKLM:\SYSTEM\CurrentControlSet\Control\Nls\CodePage ACP)))
  • 关于powershell - 如何更改我的 Powershell 脚本,以便它以 ANSI-Windows-1252 编码写入输出文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55265157/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com