gpt4 book ai didi

python - 在Python中提取名字和姓氏

转载 作者:行者123 更新时间:2023-11-28 17:44:24 25 4
gpt4 key购买 nike

我正在尝试提取大文本(大约 20 页)中的所有名字和姓氏(例如:John Johnson)。

我使用 \. 作为分隔符进行拆分,并且有我的正则表达式:

\b([A-Z]{1}[a-z]+\s{1})([A-Z]{1}[a-z]+)\b

不幸的是,我只得到了文本的所有行,而不仅仅是名字和姓氏:

Suddenly, Mary Poppins flew away with her umbrella
Later in the day, John.... bla bla bla

有人可以帮我吗?

最佳答案

尝试

regex = re.compile("\b([A-Z]{1}[a-z]+) ([A-Z]{1}[a-z]+)\b")
string = """Suddenly, Mary Poppins flew away with her umbrella
Later in the day, John Johnson did something."""
regex.findall(string)

我得到的输出是:

[(u'Mary', u'Poppins'), (u'John', u'Johnson')]

关于python - 在Python中提取名字和姓氏,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20353995/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com