gpt4 book ai didi

php - preg_split 不删除搜索模式

转载 作者:可可西里 更新时间:2023-11-01 00:20:23 27 4
gpt4 key购买 nike

我有数千个文本文件要解析,它是一个遵循特定模式的产品目录。

它有两个序列号,其中一个我将整个文本拆分成一个数组,每个键一个产品。

问题是我在 preg_split 中使用的序列号从产品中删除了,而我需要它。

这是一个原始产品:

1532.000028-01532.213.00010875-8
TRES ANÉIS, DOIS PENDENTES, DOIS BRINCOS, SENDO UM
COM
TARRACHA DE METAL NÃO NOBRE, DE: OURO, OURO BRANCO BAIXO;
CONTÉM: diamantes, pérola cultivada, pedra, massa; CONSTAM: amassada(s),
incompleta(s), PESO LOTE: 13,50G (TREZE GRAMAS E CI NQUENTAR$ 901,00
Valor Grama: 66,74

第一个数字是两个序列号,由于 PDF 解析器的缺陷,它们粘在一起。

这是我用来将数组拆分为产品的正则表达式:

$texto = preg_split("/([0-9]{4}[.][0-9]{6}[-][0-9]{1})+/",$texto);

输出:

1532.213.00010875-8
TRES ANÉIS, DOIS PENDENTES, DOIS BRINCOS, SENDO UM
COM
TARRACHA DE METAL NÃO NOBRE, DE: OURO, OURO BRANCO BAIXO;
CONTÉM: diamantes, pérola cultivada, pedra, massa; CONSTAM: amassada(s),
incompleta(s), PESO LOTE: 13,50G (TREZE GRAMAS E CI NQUENTAR$ 901,00
Valor Grama: 66,74

如您所见,第一个序列已从输出中删除。我需要它。我如何拆分这些产品,同时保留两个数组?

最佳答案

将您的捕获组更改为 lookahead ,像这样:

$texto = preg_split("/(?=[0-9]{4}[.][0-9]{6}[-][0-9]{1})/",$texto);

关于php - preg_split 不删除搜索模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27538802/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com