gpt4 book ai didi

python - 从 Python 中的字符串中删除所有冠词、连接词等

转载 作者:太空狗 更新时间:2023-10-30 00:37:22 26 4
gpt4 key购买 nike

我有一个包含很多句子的列表。我想遍历列表,从所有句子中删除“and”、“the”、“a”、“are”等词。

我试过这个:

def removearticles(text):


articles = {'a': '', 'an':'', 'and':'', 'the':''}
for i, j in articles.iteritems():
text = text.replace(i, j)
return text

但是,正如您可能知道的那样,这将删除出现在单词中间的“a”和“an”。我只需要删除由空格分隔的单词实例,而不是当它们在单词中时。最有效的方法是什么?

最佳答案

我会选择正则表达式,比如:

def removearticles(text):
re.sub('(\s+)(a|an|and|the)(\s+)', '\1\3', text)

或者如果您还想删除前导空格:

def removearticles(text):
re.sub('\s+(a|an|and|the)(\s+)', '\2', text)

关于python - 从 Python 中的字符串中删除所有冠词、连接词等,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4709665/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com