gpt4 book ai didi

machine-learning - 特遣部队/以色列国防军可以考虑上课吗

转载 作者:行者123 更新时间:2023-11-30 08:26:25 27 4
gpt4 key购买 nike

使用分类算法(例如朴素贝叶斯或 SVM)和 StringToWordVector,是否可以使用 TF/IDF 并计算整个当前类中的术语频率,而不是仅查看单个文档?

让我解释一下,我希望计算能够为给定类(不仅仅是给定文档)非常频繁但在整个语料库中不太频繁的单词提供高分。

是否可以开箱即用,或者是否需要一些额外的开发?

谢谢:)

最佳答案

I would like the computation to give high score to words that are very frequent for a given class (not just for a given document) but not very frequent in the whole corpus.

您似乎想要监督术语权重。我不知道有任何现成的实现,但是有很多 literature about it 。例如。加权方案 tf-χ2 用 χ2 独立性测试的结果替换 idf,因此统计上依赖于某些类别的项得到提升,还有其他几个项。

Tf-idf 本身本质上是不受监督的。

关于machine-learning - 特遣部队/以色列国防军可以考虑上课吗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19321571/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com