gpt4 book ai didi

python - 如何使用正则表达式提取第二个大写字母后的所有文本(数字、字母、符号)?

转载 作者:行者123 更新时间:2023-12-02 15:57:43 25 4
gpt4 key购买 nike

They won.             Elles gagnèrent.
They won. Ils ont gagné.
They won. Elles ont gagné.
Tom came. Tom est venu.
Tom died. Tom est mort.
Tom knew. Tom savait.
Tom left. Tom est parti.
Tom left. Tom partit.
Tom lied. Tom a menti.
Tom lies. Tom ment.
Tom lost. Tom a perdu.
Tom paid. Tom a payé.

我在组合一个提取第二个大写字母(包括它)后的所有文本的正则表达式模式时遇到了一些问题。

例如:

They won.             Elles gagnèrent.

在这种情况下你应该提取:

Elles gagnèrent.

这是我的代码,但效果不佳:

import re

line = "They won. Elles gagnèrent." #for example this case

match = re.search(r"\s¿?(?:A|Á|B|C|D|E|É|F|G|H|I|Í|J|K|LL|L|M|N|Ñ|O|Ó|P|Q|R|S|T|U|Ú|V|W|X|Y|Z)\s((?:\w\s)+)?" , line)

n_sense = match.group()

print(repr(n_sense)) #should print "Elles gagnèrent."

最佳答案

您可以尝试以下代码。

with open(file, "r") as r:
for line in r:
line = re.sub('^[^A-Z]*[A-Z][^A-Z]*','', line)
print(line, end="")

关于python - 如何使用正则表达式提取第二个大写字母后的所有文本(数字、字母、符号)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71209959/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com