- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个如下所示的文本 (.txt) 文件:
Person Person Name Person Approval Supervisor Payroll Name Application Supplier Start Date End Date ArchivedType Number Status Name NameAgency D'Cunha, Yionue 123456 NOT ENTERED Power, Projects CONTRACTContractor Mehash SUPPLIER_1 10-DEC-16 16-DEC-16 NoEmployee Vughila, 132456 WORKING Miro, Company-abcde INPayroll 10-DEC-16 16-DEC-16 No Proshont Profal Monthly 10-DEC-16 16-DEC-16 NoEmployee Diiri, Maaor 113456 NOT ENTERED Kargannkir,Company-abcde INPayroll Bivnath Monthly 10-DEC-16 16-DEC-16 NoEmployee Kimit, Gongobhar111111 WORKING Chondorkor,Company-abcde INProjects 10-DEC-16 16-DEC-16 No Avissku MonthlyEmployee Kalvornu, 110077 WORKING Kindipur, Company-abcde INPayroll 10-DEC-16 16-DEC-16 No Churali Barinakir MonthlyAgency Dhilorii, 100009 NOT ENTERED Nook, Projects CONTRACTContractorBohishik Lurukont SUPPLIER_2
I get this file from a report generated by a software. I'd like to parse the file and export the data to CSV. I tried this, but that didn't help because the structure of my data is so different.
Then I tried this:
$input = Get-Content "C:\Users\user.name\Desktop\GBS\text_file.txt"
$data = $input[1..($input.Length - 1)]
$maxLength = 0
$objects = foreach ($record in $data) {
$split = $record -split "\s{2,}|\t+"
if ($split.Length -gt $maxLength) {
$maxLength = $split.Length
}
$props = @{}
for ($i=0; $i -lt $split.Length; $i++) {
$props.Add([String]($i+1), $split[$i])
}
New-Object -TypeName PSObject -Property $props
}
$headers = [String[]](1..$maxLength)
$objects |
Select-Object $headers |
Export-Csv -NoTypeInformation -Path "C:\Users\user.name\Desktop\GBS\out.csv"
但这弄乱了每一行的第二行。问题是在原始文本文件中,每隔一行也是第一行的一部分。在某些情况下,甚至第三行也是第一行数据的一部分。
如果我可以提供任何信息来更好地表达我的问题,请告诉我。
在@Ansgar 发表评论后我尝试了这个:
# read text file into single string and remove header
$rawText = Get-Content 'C:\path\to\input.txt' | Out-String
# split string into individual records
$data = $rawText -replace "`r" -split '\n\n+' | Select-Object -Skip 1
$parsedData = foreach ($record in $data) {
$prop = @{}
$record -split '\n' | ForEach-Object {
$prop['PersonType'] += $_.Substring(0, 10).Trim()
$prop['PersonName'] += $_.Substring(10, 16).Trim()
$prop['PersonNumber'] += $_.Substring(26, 9).Trim()
$prop['ApprovalStatus'] += $_.Substring(35, 13).Trim()
$prop['Supervisor'] += $_.Substring(48, 11).Trim()
$prop['PayrollName'] += $_.Substring(59, 16).Trim()
$prop['ApplicationName'] += $_.Substring(75, 13).Trim()
$prop['Supplier'] += $_.Substring(88, 9).Trim()
$prop['StartDate'] += $_.Substring(97, 12).Trim()
$prop['EndDate'] += $_.Substring(109, 9).Trim()
$prop['Archived'] += $_.Substring(118, 8).Trim()
}
New-Object -Type PSObject -Property $prev
}
$parsedData | Export-Csv 'C:\path\to\output.txt' -NoType
但现在我在我的目标文件夹中得到了一个空白的输出 CSV 文件。我在某处遗漏了什么吗?
最佳答案
我有一个解决方案,但是......
它使用两个拆分,第一个拆分为 (Person|Agency|Employee)
拆分记录(存在需要 if 的缺陷),
第二个在换行符处拆分,然后解析偏移量+长度。
由于样本数据不一致,这也不完美。
$InFile = 'Q:\Test\2016-12\19\41225200.txt'
$OutFile= 'C:\path\to\output.txt'
$Delimiter = '(Person|Agency|Employee)'
#'$Escaped = [regex]::Escape($Delimiter)
$Split = "(?!^)(?=$Delimiter)"
$parsedData = (Get-Content $InFile -Raw) -split $Split |
ForEach-Object {
$prop = @{}
If ($_.Length -ge 30 ) {
ForEach ($Line in $_.split("`n")) {
$Line+=" "*130
$prop['PersonType'] += $Line.Substring( 0, 10).Trim()
$prop['PersonName'] += $Line.Substring(10, 16).Trim()
$prop['PersonNumber'] += $Line.Substring(26, 9).Trim()
$prop['ApprovalStatus'] += $Line.Substring(35, 13).Trim()
$prop['Supervisor'] += $Line.Substring(48, 11).Trim()
$prop['PayrollName'] += $Line.Substring(59, 16).Trim()
$prop['ApplicationName'] += $Line.Substring(75, 12).Trim()
$prop['Supplier'] += $Line.Substring(87, 10).Trim()
$prop['StartDate'] += $Line.Substring(97, 9).Trim()
$prop['EndDate'] += $Line.Substring(108, 9).Trim()
$prop['Archived'] += $Line.Substring(117, 8).Trim()
}
}
New-Object -TypeName PSObject -Property $prop
}
$parsedData
输出
Supervisor : ApplicatioName
ApplicationName : t Date End DName
Archived :
PersonType : Person AType
PersonName : pproval Supe
Supplier : ate Archiv
StartDate : ed
ApprovalStatus : yroll NameStatus
PayrollName : n Supplier Star
PersonNumber : rvisor PaNumber
EndDate :
Supervisor : Power,Mehash
ApplicationName : Projects
Archived : No
PersonType : AgencyContractor
PersonName : D'Cunha, Yionue
Supplier : CONTRACTSUPPLIER_1
StartDate : 10-DEC-16
ApprovalStatus : NOT ENTERED
PayrollName :
PersonNumber : 123456
EndDate : 16-DEC-16
Supervisor : Miro,Profal
ApplicationName : Payroll
Archived : NoNo
PersonType : Employee
PersonName : Vughila,Proshont
Supplier :
StartDate : 10-DEC-1610-DEC-16
ApprovalStatus : WORKING
PayrollName : Company-abcde INMonthly
PersonNumber : 132456
EndDate : 16-DEC-1616-DEC-16
我对 export-csv 的尝试也是空的。
关于powershell - 解析文本文件并保存为 .csv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41225200/
我正在寻找实现 PowerShell 提供程序 在 电源外壳。 我一直在想,如果我只是定义类型,然后将它们导入我的 session (导入模块),我应该能够让它们可用。 例如,这个 不工作但它沿着我想
我创建的脚本使用了组件,这些组件仅在32位版本的Powershell中可用。 默认情况下,Windows使用Powershell x64执行脚本,这会导致一些错误。 是一种在脚本开头设置值以强制Win
是否可以从 Powershell 中检测它是否是嵌套 shell? 如果我打开 Powershell 或 cmd.exe 窗口,然后输入 powershell 在那里,是否有一个神奇的 $host.s
随着 PowerShell Core 的发布,应用程序在使用托管自动化库 (system.management.automation) 时如何选择调用哪个版本的 Powershell(Powershe
最近,我加入了我企业的 Windows 团队,凭借我的开发人员背景(一般是 Java、.NET 和 Web),我很快就对 PowerShell 产生了兴趣。我可以看到它比普通的旧批处理文件、VB 更有
假设我有一个 powershell 脚本,它在我当前路径的相对路径中包含一个 Powershell 哈希。让我们称之为“name.ps1”,它包含: $names = @{ "bob" = "b
我想为我正在构建的自定义 Powershell Commandlet 使用 SqlServerCmdletSnapin。如果我将以下代码添加到 PSM1 的开头: if ( (Get-PSSnapin
如何调用从 PowerShell 脚本中获取命名参数的 PowerShell 脚本? foo.ps1: param( [Parameter(Mandatory=$true)][String]$a=''
我即将为 Windows 管理员编写一个 PowerShell 脚本,以帮助他们完成与部署 Web 应用程序相关的某些任务。 有什么理由让我应该赞成或排除开发 PowerShell 模块 (.psm1
我的 powershell 模块有一个函数,我希望它返回一个非零退出代码。但是,作为一个模块函数,当我运行 Import-Module 时,它会加载到 powershell 控制台的上下文中。所以,当
我在这个问题上花了最后 4 个小时,非常感谢您提供的任何意见。 我需要使用不同的凭据调用 powershell 脚本并将参数传递给该脚本。 安装 WISEScript 中包装的程序后,此脚本开始收集机
我有一个场景,我需要将 powershell 命令的命令和输出转发到另一个进程以进行日志记录和处理。 我希望这个控制台尽可能接近 powershell,因此不希望将它简单地托管在另一个控制台程序中。
我正在尝试让一个主 PowerShell 脚本运行所有其他脚本,同时等待 30-60 秒以确保完成任务。我尝试过的所有其他操作都不会停止/等待第一个脚本及其进程完成,然后才能同时完成所有其他脚本,并且
我正在编写一个脚本来使用多个 plink (PuTTY) session 作为 Windows 版本的 clustersh。然而,我陷入困境,因为我想从 powershell 打开多个 Powersh
我读了这个答案:How to Open Powershell from Powershell start powershell 这将打开基础的大分辨率 PS 实例。如何打开 PS(x86)? 最佳答案
我很想知道我们是否可以在 Powershell 中做到这一点。 使用 Out-File 命令,我们可以通过管道将其输出写入文件。这样我就可以将我所有的历史命令发送到一个文本文件中。 问题是我可以在每次
我在 about_Pipelines 阅读了有关 PowerShell 中的管道工作原理的信息,并了解到管道一次传送一个对象。 所以,这个 Get-Service | Format-Table -Pr
我正在尝试像这样从 powershell 启动一个进程:- $proc = (start-process $myExe -argumentList '/myArg True' -windowStyle
## To run the script # .\get_status.ps1 -Hostname -Service_Action -Service_Name #$Hostname = "hos
让我们使用 powershell 命令 Write-Host "red text"-Fore red这会在红色前景中显示“红色文本”。 但是,您希望文本以稍微亮一点的方式显示字体颜色,浅红色。 有没有
我是一名优秀的程序员,十分优秀!