gpt4 book ai didi

NLP - 为什么 "not"是停用词?

转载 作者:行者123 更新时间:2023-12-02 04:37:13 25 4
gpt4 key购买 nike

<分区>

我试图在执行主题建模之前删除停用词。我注意到一些否定词(not、nor、never、none 等)通常被认为是停用词。例如,NLTK、spacy 和 sklearn 在它们的停用词列表中包含“not”。但是,如果我们从下面的这些句子中删除“not”,它们将失去重要意义,并且对于主题建模或情感分析而言,这将是不准确的。

1). StackOverflow is helpful      => StackOverflow helpful
2). StackOverflow is not helpful => StackOverflow helpful

谁能解释为什么这些否定词通常被认为是停用词?

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com