gpt4 book ai didi

c# - 使用正则表达式提取重复模式

转载 作者:行者123 更新时间:2023-11-30 17:37:28 25 4
gpt4 key购买 nike

我有一些文本,其中写有(id(以 Pnumber 的形式),破折号和名称)的列表。比如:

P1 - code23
P2 - name asd, P3 -name3
P3 - 837/55 P5 - code/55

如您所见,一对 PX - 名称可以用\n、逗号或简单空格分隔。

使用正则表达式模式

(((?<id>P\d)(\s)?-(\s)?(?<name>(.)*)(,)?(\n)?))   

我可以提取在不同行重复的名称组匹配项,但不能提取由 , 或空格分隔的匹配项。从上面的文本中提取的名称是

code23 (right)
name asd, P3 -name3 (wrong)
837/55 P5 - code/55 (wrong)

如何修改我的模式?

最佳答案

你可以试试

(?<id>P\d+)\s*-\s*(?<name>.*?)(?=$|,?\s*P\d)

参见 regex demo (演示中添加\r?只是因为打开了多行模式并且输入是多行,如果字符串单独处理,则不需要\r?和多行模式)。

解释:

  • (?<id>P\d+) -组 ID,P + 1+ 位数字
  • \s*-\s* - 0+ 空格,-又是 0+ 个空格
  • (?<name>.*?) - 捕获除换行符以外的 0+ 个字符的组名称,直到第一个
  • (?=$|,?\s*P\d) - 字符串结尾(是的,唯一的)或可选的逗号,0+ 空格,P和一个数字。

结果:

enter image description here

关于c# - 使用正则表达式提取重复模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38016115/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com