gpt4 book ai didi

regex - 使用 powershell 捕获数组中的正则表达式匹配

转载 作者:行者123 更新时间:2023-12-02 01:00:47 25 4
gpt4 key购买 nike

我们有一个从 Mac 用户计算机导出的大型 .vcf。

导出联系人的过程产生了一个 .vcf,它将所有联系人打包到一个文件中。我使用 notepad++ 将所有“BEGIN:”实例替换为“\nBEGIN:”,这样我今晚就可以 sleep 了。

计划是将我的 reg 表达式的每个匹配项放入一个数组中,然后将每个字符串输出到许多唯一命名的 .vcf 文件中

(我计划稍后将字符串“BEGIN:VCARD”和“END:VCARD”添加回每个文件的开头和结尾。)

这是我们正在处理的数据的片段:

BEGIN:VCARD
VERSION:3.0
PRODID:-//Apple Inc.//Mac OS X 10.13.4//EN
N:;;;;
TEL;type=CELL;type=VOICE;type=pref:+18005555555
UID:3fe8e0-421c-4c6a-bfa-38c75df8c07
X-ABUID:3FE8490-421C-4C6A-B2FA-38C15DF8C07:ABPerson
END:VCARD

BEGIN:VCARD
VERSION:3.0
PRODID:-//Apple Inc.//Mac OS X 10.13.4//EN
N:;<blah@company.org>;;;
FN:<blah@company.org>
item1.EMAIL;type=INTERNET;type=pref:blah@company.org
item1.X-ABLabel:_$!<Other>!$_
UID:5ad596-a879-4c98-9f56-2ef90efe32f
X-ABUD:DB5C20C-6DFC-450F-A752-D57964F6F3A:ABPerson
END:VCARD

...

我接近下面的代码,但它只返回第一个匹配项

$String = cat C:\temp\contacts.txt            
$Regex = [Regex]::new("(?<=BEGIN:VCARD)(.*?)(?=END:VCARD)")
$Match = $Regex.Match($String)
if($Match.Success)
{
$Match.Value
}

always cite your source

我需要它来解析整个字符串并找到所有匹配项,就像这个家伙所做的那样:

$matches_found = @()
cat myfile.txt | %{
if ($_ -match '(?<=BEGIN:VCARD)(.*?)(?=END:VCARD)'){
$matches_found += $matches[1]
}
}

always cite your source

但是当我将我的正则表达式放入这段代码时,它没有找到任何匹配项

最佳答案

您只要求在您发布的每个代码块中进行一次匹配。您可能希望改用 RegEx 匹配。

这应该让你得到你想要的:

$VCardData = @'
BEGIN:VCARD
VERSION:3.0
PRODID:-//Apple Inc.//Mac OS X 10.13.4//EN
N:;;;;
TEL;type=CELL;type=VOICE;type=pref:+18005555555
UID:3fe8e0-421c-4c6a-bfa-38c75df8c07
X-ABUID:3FE8490-421C-4C6A-B2FA-38C15DF8C07:ABPerson
END:VCARD

BEGIN:VCARD
VERSION:3.0
PRODID:-//Apple Inc.//Mac OS X 10.13.4//EN
N:;<blah@company.org>;;;
FN:<blah@company.org>
item1.EMAIL;type=INTERNET;type=pref:blah@company.org
item1.X-ABLabel:_$!<Other>!$_
UID:5ad596-a879-4c98-9f56-2ef90efe32f
X-ABUD:DB5C20C-6DFC-450F-A752-D57964F6F3A:ABPerson
END:VCARD
'@

# Use RegEx match to search for strings across line breaks.
$VcardRegEx = '(?s)(?<=BEGIN:VCARD).*?(?=END:VCARD)'

# Select all matches
[RegEx]::Matches($VCardData,$VcardRegEx).Value

#results

VERSION:3.0
PRODID:-//Apple Inc.//Mac OS X 10.13.4//EN
N:;;;;
TEL;type=CELL;type=VOICE;type=pref:+18005555555
UID:3fe8e0-421c-4c6a-bfa-38c75df8c07
X-ABUID:3FE8490-421C-4C6A-B2FA-38C15DF8C07:ABPerson


VERSION:3.0
PRODID:-//Apple Inc.//Mac OS X 10.13.4//EN
N:;<blah@company.org>;;;
FN:<blah@company.org>
item1.EMAIL;type=INTERNET;type=pref:blah@company.org
item1.X-ABLabel:_$!<Other>!$_
UID:5ad596-a879-4c98-9f56-2ef90efe32f
X-ABUD:DB5C20C-6DFC-450F-A752-D57964F6F3A:ABPerson

根据 OP 的后续问题进行更新

# How many records are in the set
([RegEx]::Matches($VCardData,$VcardRegEx).Value).Count

# Results
2

# Output each record as a separate file

# Set the counter
$VCardCounter = 0

# Loop through the dataset and output to a new file for each

ForEach($Vcard in ([RegEx]::Matches($VCardData,$VcardRegEx).Value))
{
$VCardFileName = 'VCard' + ++$VCardCounter + ".txt"
New-Item -Path $pwd -ItemType File -Name $VCardFileName
Add-Content -Value $Vcard -Path "$pwd\$VCardFileName"
}

Get-ChildItem -Path "$pwd\Vcard*"

# List the new files

Directory: D:\Scripts


Mode LastWriteTime Length Name
---- ------------- ------ ----
-a---- 03-Jun-18 15:36 209 VCard1.txt
-a---- 03-Jun-18 15:36 286 VCard2.txt


# Review the contents of the new files
Get-Content (Get-ChildItem -Path "$pwd\Vcard*")

# Results

VERSION:3.0
PRODID:-//Apple Inc.//Mac OS X 10.13.4//EN
N:;;;;
TEL;type=CELL;type=VOICE;type=pref:+18005555555
UID:3fe8e0-421c-4c6a-bfa-38c75df8c07
X-ABUID:3FE8490-421C-4C6A-B2FA-38C15DF8C07:ABPerson


VERSION:3.0
PRODID:-//Apple Inc.//Mac OS X 10.13.4//EN
N:;<blah@company.org>;;;
FN:<blah@company.org>
item1.EMAIL;type=INTERNET;type=pref:blah@company.org
item1.X-ABLabel:_$!<Other>!$_
UID:5ad596-a879-4c98-9f56-2ef90efe32f
X-ABUD:DB5C20C-6DFC-450F-A752-D57964F6F3A:ABPerson

关于regex - 使用 powershell 捕获数组中的正则表达式匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50659915/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com