regex - 如何仅获取 RegEx 的第一个匹配项(UiPath Studio RegEx Based Extractor)-6ren

regex - 如何仅获取 RegEx 的第一个匹配项(UiPath Studio RegEx Based Extractor)

转载作者：行者123 更新时间：2023-12-04 01:18:02

24

4

我使用 UiPath Studio 的 OCR 从 PDF 中提取了以下文本。这是同一块文本重复 3 次，因为它是同一 PDF 页面的原始、重复和三次重复。

Os bens/serviços foram colocados à disposição do adquirente em 2020-04-16 * Data/Hora início de transporte: 2020-04-16 às 11:52

Total Líquido               500,00
Total de Descontos 500,00         
Desconto Documento                
Total de IVA                115,00
Total do Documento (EUR)    615,00

IVA      Incidência   Valor do IVA
Isento                            
6%                                
13%                               
23%      500,00       115,00      

b5El-Processado por programa certificado n.º75/AT.

Os bens/serviços foram colocados à disposição do adquirente em 2020-04-16 * Data/Hora início de transporte: 2020-04-16 às 11:52

Total Líquido               500,00
Total de Descontos 500,00         
Desconto Documento                
Total de IVA                115,00
Total do Documento (EUR)    615,00

IVA      Incidência   Valor do IVA
Isento                            
6%                                
13%                               
23%      500,00       115,00      

b5El-Processado por programa certificado n.º75/AT.

Os bens/serviços foram colocados à disposição do adquirente em 2020-04-16 * Data/Hora início de transporte: 2020-04-16 às 11:52

Total Líquido               500,00
Total de Descontos 500,00         
Desconto Documento                
Total de IVA                115,00
Total do Documento (EUR)    615,00

IVA      Incidência   Valor do IVA
Isento                            
6%                                
13%                               
23%      500,00       115,00      

b5El-Processado por programa certificado n.º75/AT.

我需要提取“-Processado por programa”后面的 4 个字符代码，但只想要 1 个匹配项或第一个匹配项。
已经试过了 [^*]+(?=-Processado\spor\sprograma)和 (.*?)(?=-Processado\spor\sprograma)但这输出了我 3 场比赛。
当我删除 /g 时它起作用了标志，但我正在使用 UiPath Studio 的 RegEx 提取器，但我不知道如何删除该程序上的该标志。

最佳答案

您可以匹配所有不以 4 个单词字符开头的行和 -Processado por programa使用负前瞻。
当您遇到该行时，捕获第 1 组中的前 4 个单词字符

\A.*(?:\r?\n(?!\w{4}-Processado\spor\sprograma\b).*)*\r?\n(\w{4})

说明

\A.*断言字符串开头的位置和除换行符以外的任何字符 0+ 次

(?:非捕获组

\r?\n匹配换行符

(?!\w{4}-Processado\spor\sprograma\b)负前瞻，断言不是 -Processado por programa直接向右

.*匹配该行的其余部分

)*关闭非捕获组并重复 0+ 次以匹配所有行

\r?\n(\w{4})匹配换行符并捕获 中的 4 个单词字符第 1 组

Regex demo

关于regex - 如何仅获取 RegEx 的第一个匹配项(UiPath Studio RegEx Based Extractor)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62997000/

24

4

0

文章推荐： node.js - NodeJS中axios和supertest的区别

文章推荐： quarkus - 如何在 Quarkus 中以编程方式覆盖应用程序属性

文章推荐： functional-programming - 使用条件查询参数构建 URL

文章推荐： Python 子字符串 - 将第 n 个字符拆分到某个字符串的左侧

org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeSearchExtractor类的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeSearchExtractor类的一些代码示例，展示
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeStreamExtractor类的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeStreamExtractor类的一些代码示例，展示
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeTrendingExtractor类的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeTrendingExtractor类的一些代码示例，
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubePlaylistExtractor类的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubePlaylistExtractor类的一些代码示例，
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeSubscriptionExtractor类的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeSubscriptionExtractor类的一些代
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeTrendingExtractor.getUrl()方法的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeTrendingExtractor.getUrl()
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubePlaylistExtractor.getServiceId()方法的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubePlaylistExtractor.getServi
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeSubscriptionExtractor.()方法的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeSubscriptionExtractor.()方法
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeChannelExtractor.fetchPage()方法的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeChannelExtractor.fetchPage
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubePlaylistExtractor.getUrl()方法的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubePlaylistExtractor.getUrl()
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeChannelExtractor.getName()方法的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeChannelExtractor.getName()
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeTrendingExtractor.getNextPageUrl()方法的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeTrendingExtractor.getNextP
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeSearchExtractor.getUrl()方法的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeSearchExtractor.getUrl()方法
org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeStreamExtractor.getSubtitles()方法的使用及代码示例
本文整理了Java中org.schabi.newpipe.extractor.services.youtube.extractors.YoutubeStreamExtractor.getSubtitl
testing - JMeter中配备动态正则表达式的Regex Extractor
有什么方法可以使用由动态变量(例如 ${var})组成的正则表达式来设置正则表达式提取器。问的理由是因为我的测试计划的一部分是从html响应中获取某个用户帐户的用户ID，因此后续Jmeter将继续以
Scala Extractor unapply 调用了两次
我刚刚发现我的提取器中的 unapply 出于某种原因被调用了两次。任何人都知道为什么，以及如何避免它？ val data = List("a","b","c","d","e") object Uap
python - 无法使用python迭代调用yahoo的term extractor api
我正在尝试遍历目录中的 50 多个文件。每个文件都有一些文本，我正在尝试使用 Yahoo Term Extractor 查找关键字.我能够从每个文件中提取文本，但我无法使用文本作为输入来迭代调用 AP
Scala Constructor 模式与 Extractor 模式匹配
构造器模式和抽取器模式匹配有什么区别？在 Programming in Scala 中，作者区分了第 15 章中讨论的构造函数模式和第 26 章中讨论的提取器模式。构造函数模式的例子: abstra
JMeter Xpath2 extractor id 匹配多个条件
下面是示例 XML 片段，我试图从中筛选出符合以下两个条件的文章的 ID。目前，我可以在下面的表达式的帮助下为个别情况提取 ID 获取可用文章，Xpath2 表达式 = (//*//*//*//*[s
Scala模式匹配: Are parametrized extractor objects possible?
是否可以创建一个可以使用的 Extractor 对象，例如: val x = 42 x match { case GreaterThan(80) => println("5") case Gr

首页

博学

6Ren·AI

商城

regex - 如何仅获取 RegEx 的第一个匹配项(UiPath Studio RegEx Based Extractor)