gpt4 book ai didi

python - 替换长列表中的元素Python

转载 作者:行者123 更新时间:2023-12-01 22:53:58 26 4
gpt4 key购买 nike

我正在尝试用标签替换更大列表(300 万个元素)中的多个元素(大约 40k)。下面的代码可以工作,但是速度非常慢。

def UNKWords(words):
words = Counter(words)
wordsToBeReplaced = []
for key, value in words.items():
if(value == 1):
wordsToBeReplaced.append(key)
return wordsToBeReplaced

wordsToBeReplaced = UNKWords(trainingWords)

replacedWordsList = ["<UNK>" if word in wordsToBeReplaced else word for word in trainingWords]

是否有更有效的方法来替换如此大的列表中的元素?

最佳答案

您可以将 wordsToBeReplaced 设置为一个集合,以便可以在平均恒定时间内完成查找,而不是线性时间:

def UNKWords(words):
return {word for word, count in Counter(words).items() if count == 1}

关于python - 替换长列表中的元素Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60531940/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com