gpt4 book ai didi

python - 根据另一个列表中的值从列表中过滤值的最有效方法是什么

转载 作者:行者123 更新时间:2023-11-28 21:51:02 25 4
gpt4 key购买 nike

我目前创建了一个这样的列表:

stopfile = os.path.join(baseDir, inputPath, STOPWORDS_PATH)
stopwords = set(sc.textFile(stopfile).collect())
print 'These are the stopwords: %s' % stopwords

def tokenize(string):
""" An implementation of input string tokenization that excludes stopwords
Args:
string (str): input string
Returns:
list: a list of tokens without stopwords
"""
res = list()
for word in simpleTokenize(string):
if word not in stopwords:
res.append(word)
return res

simpleTokenize 只是一个基本的字符串拆分函数,它返回一个字符串列表。

最佳答案

这很好。如果您想以更“Pythonic”的方式进行操作(一行代码而不是 4 行),您可以使用列表理解:

res = [word for word in simpleTokenize(string) if word not in stopwords]

关于python - 根据另一个列表中的值从列表中过滤值的最有效方法是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31017190/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com