gpt4 book ai didi

regex - 如何仅获取 RegEx 的第一个匹配项(UiPath Studio RegEx Based Extractor)

转载 作者:行者123 更新时间:2023-12-04 01:18:02 24 4
gpt4 key购买 nike

我使用 UiPath Studio 的 OCR 从 PDF 中提取了以下文本。这是同一块文本重复 3 次,因为它是同一 PDF 页面的原始、重复和三次重复。

Os bens/serviços foram colocados à disposição do adquirente em 2020-04-16 * Data/Hora início de transporte: 2020-04-16 às 11:52

Total Líquido 500,00
Total de Descontos 500,00
Desconto Documento
Total de IVA 115,00
Total do Documento (EUR) 615,00

IVA Incidência Valor do IVA
Isento
6%
13%
23% 500,00 115,00

b5El-Processado por programa certificado n.º75/AT.

Os bens/serviços foram colocados à disposição do adquirente em 2020-04-16 * Data/Hora início de transporte: 2020-04-16 às 11:52

Total Líquido 500,00
Total de Descontos 500,00
Desconto Documento
Total de IVA 115,00
Total do Documento (EUR) 615,00

IVA Incidência Valor do IVA
Isento
6%
13%
23% 500,00 115,00

b5El-Processado por programa certificado n.º75/AT.

Os bens/serviços foram colocados à disposição do adquirente em 2020-04-16 * Data/Hora início de transporte: 2020-04-16 às 11:52

Total Líquido 500,00
Total de Descontos 500,00
Desconto Documento
Total de IVA 115,00
Total do Documento (EUR) 615,00

IVA Incidência Valor do IVA
Isento
6%
13%
23% 500,00 115,00

b5El-Processado por programa certificado n.º75/AT.
我需要提取“-Processado por programa”后面的 4 个字符代码,但只想要 1 个匹配项或第一个匹配项。
已经试过了 [^*]+(?=-Processado\spor\sprograma)(.*?)(?=-Processado\spor\sprograma)但这输出了我 3 场比赛。
当我删除 /g 时它起作用了标志,但我正在使用 UiPath Studio 的 RegEx 提取器,但我不知道如何删除该程序上的该标志。

最佳答案

您可以匹配所有不以 4 个单词字符开头的行和 -Processado por programa使用负前瞻。
当您遇到该行时,捕获第 1 组中的前 4 个单词字符

\A.*(?:\r?\n(?!\w{4}-Processado\spor\sprograma\b).*)*\r?\n(\w{4})
说明
  • \A.*断言字符串开头的位置和除换行符以外的任何字符 0+ 次
  • (?:非捕获组
  • \r?\n匹配换行符
  • (?!\w{4}-Processado\spor\sprograma\b)负前瞻,断言不是 -Processado por programa直接向右
  • .*匹配该行的其余部分

  • )*关闭非捕获组并重复 0+ 次以匹配所有行
  • \r?\n(\w{4})匹配换行符并捕获 中的 4 个单词字符第 1 组

  • Regex demo

    关于regex - 如何仅获取 RegEx 的第一个匹配项(UiPath Studio RegEx Based Extractor),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62997000/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com