gpt4 book ai didi

python - 从列表中删除带有自定义停用词的短语

转载 作者:行者123 更新时间:2023-11-28 21:31:35 25 4
gpt4 key购买 nike

我有两个列表

listA = ['New Delhi', 'Moscow', 'Berlin', 'France', 'To Washington']
stopwordlist = ['new', 'To']

我正在尝试得到这样的东西

finalList = ['Moscow', 'Berlin', 'France']

如果我正在寻找整个单词,我到目前为止所尝试的方法是有效的:

listB = []
for item in listA:
if item not in stopwordlist:
listB.append(item)
else:
continue
....
....
return listB

我们可以拆分项目,然后检查停用词列表中的项目。但这对于许多解决方法来说似乎都是如此。或者我可以使用正则表达式 re.match

最佳答案

这是一种方法,

>>> listA = ['New Delhi', 'Moscow', 'Berlin', 'France', 'To Washington']
>>> stopwordlist = ['new', 'To']
>>> finalList = [i for i in listA if not any(j.lower() in i.lower() for j in stopwordlist)]
>>> finalList
['Moscow', 'Berlin', 'France']

或者您可以使用内置的过滤器功能。

>>> listA = ['New Delhi', 'Moscow', 'Berlin', 'France', 'To Washington']
>>> stopwordlist = ['new', 'To']
>>> list(filter(lambda x: not any(j.lower() in x.lower() for j in stopwordlist), listA))
['Moscow', 'Berlin', 'France']

关于python - 从列表中删除带有自定义停用词的短语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57816940/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com