gpt4 book ai didi

nlp - TF-IDF 有没有比使用词频向量更糟糕的情况?

转载 作者:行者123 更新时间:2023-12-04 20:03:37 43 4
gpt4 key购买 nike

我现在在做文本分类。 TF-IDF 有没有比使用词频向量更糟糕的情况?怎么解释呢?谢谢

最佳答案

Both metrics ...discriminate along two dimensions – informativeness (IDF) and aboutness (TF)

Documents that contain hundreds of occurrences of some high IDF term are goingto result in poor, noisy matches ... in ex. spam documents

一本好书 - Beyond bags of words , (Donald A. Metzler Jr. 2007)

关于nlp - TF-IDF 有没有比使用词频向量更糟糕的情况?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15792593/

43 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com