gpt4 book ai didi

python - 如何在Python中提取某个单词后的字符串?

转载 作者:行者123 更新时间:2023-12-01 08:35:59 27 4
gpt4 key购买 nike

我试图在字符串中获取引用号,在大多数情况下,该引用号前面带有“Ref”。或类似的东西。

例如:

Explorer II Ref.16570 Box

regex with further examples

问题是有很多不同的变体 1因为这是用户生成的内容。我如何用 python 检索以例如开头的数字引用号

数字/字符串并不总是相同的模式,例如数字。 .它们可能与字符、点和斜杠混合在一起,但对于人眼来说,每行中几乎总是有这样一个数字可识别。

例如:

Ref.16570
Ref. 16570
Referenz 216570
Referenz 01 733 7653 4159-07 4 26
331.12.42.51.01.002
166.0173
AB012012/BB01
Ref. 167.021
PAM00292
14000M
L3.642.4.56.6
161.559.50
801
666
753
116400GV
Ref.: 231.10.39.21.03.002
3233
Ref: 233.32.41.21.01.002
T081.420.97.057.01
16750
... almost each line in the example provided contains a certain ID

少量误报不会成为问题。

最佳答案

不完全确定您是否需要匹配提取,但Ref\.?([\d.]+)会提取Ref 之后的任何数字(不区分大小写),即:

import re
result = re.findall(r"Ref\.?([ \d.]+)", subject, re.IGNORECASE | re.MULTILINE)
<小时/>
['16570', '16570', '167.021', '3527']
<小时/>

Regex Demo
Python Demo

<小时/>

正则表达式说明
enter image description here

关于python - 如何在Python中提取某个单词后的字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53725752/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com