gpt4 book ai didi

python - 停用词删除困境

转载 作者:行者123 更新时间:2023-12-04 15:29:46 27 4
gpt4 key购买 nike

我正面临 NLTK 中停用词功能的困境。我正在通过使用 NLTK 删除停用词来处理来自社交媒体平台的用户生成的内容。然而,问题是我想在用户文本中保留人称代词,这对分类任务很重要。这些包括诸如“我”“你”“我们”等词。

不幸的是,停用词功能也删除了这些词,我需要它们存在。我该如何解决这个问题?

最佳答案

import nltk
from nltk.corpus import stopwords
stop_words= stopwords.words('english')
type(stop_words)
print(len(stop_words))

如果您查看输出,停用词的类型是列表。然后:

personal_pronouns= ['i', 'you', 'she', 'he', 'they'] # you can add another words for remove
for word in personal_pronouns:
if word in stop_words:
stop_words.remove(word)
print(word+ ' Deleted')
print(len(stop_words))

关于python - 停用词删除困境,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61458623/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com