gpt4 book ai didi

machine-learning - SVM文档分类中如何计算测试文档的tf-df?

转载 作者:行者123 更新时间:2023-11-30 09:30:14 25 4
gpt4 key购买 nike

在我的 SVM 中,我在文档上使用 tf-idf 进行特征提取。这些tf-idf是在整个训练文档上计算的。

现在,当我得到一个想要分类的测试文档时,如何为其生成向量?

我在计算 tf-idf 之前使用了词干提取。我也可以在测试文档上执行该操作。我有火车文档的字数。

我应该增加训练文档 count_of_words 中的单词数来计算测试文档的 tf-idf 还是应该直接使用它?

最佳答案

以与训练期间相同的方式计算它们,但是:使用基于训练文档的 idf 和来自测试文档的 tf。如果您有许多新文档进来,只需不时更新训练数据并重新训练您的模型即可。

关于machine-learning - SVM文档分类中如何计算测试文档的tf-df?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18206097/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com