gpt4 book ai didi

machine-learning - 将句子输入 RNN 时是否应该删除停用词

转载 作者:行者123 更新时间:2023-11-30 09:36:57 24 4
gpt4 key购买 nike

在词袋模型中,我知道我们应该在训练之前删除停用词和标点符号。但在 RNN 模型中,如果我想做文本分类,我是否也应该删除停用词?

最佳答案

这取决于您的模型的分类。如果您正在做一些由停用词辅助分类的事情(例如,某种程度的语法理解),那么您需要保留停用词或更改停用词列表,这样您就不会丢失该信息。例如,删除所有存在动词(is、are、should be、...)可能会弄乱在某种程度上依赖于句子结构的神经网络。

但是,如果您的分类是基于主题的(如词袋引用所建议的那样),则以相同的方式处理输入:在那些讨厌的停用词消耗宝贵的训练时间之前将其删除。

关于machine-learning - 将句子输入 RNN 时是否应该删除停用词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37325914/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com