gpt4 book ai didi

python - 关于在 gensim 中如何实现 tf-idf 模型的一些困惑

转载 作者:太空宇宙 更新时间:2023-11-04 06:33:02 25 4
gpt4 key购买 nike

我正在研究 tf-idf 模型。我不太清楚这个模型是如何实现的。当我尝试打印模型时,我现在已经构建了模型,它为同一术语提供了不同的值。以下两个术语给出了这些结果:

doc_bow = [(0, 1), (1, 1)]
val1= tf_idf_corpus[doc_bow]

doc_bow = [(0,1)]
val2=tf_idf_corpus[doc_bow]

结果如下:

val1= [(0, 0.56486634414605663), (1, 0.82518241210720711)]
val2=[(0, 1.0)]

我只是想知道,为什么第 0 项的 tf-idf 值在 val1 中为 0.5648 而在 val2 中为 1.0。

最佳答案

文档可能有助于消除您的困惑:http://radimrehurek.com/gensim/models/tfidfmodel.html

I am just curious to know, why tf-idf value of term 0 is 0.5648 in val1 and 1.0 in val2.

输出向量被归一化为单位(欧氏)长度。您可以使用 normalize 构造函数参数将其关闭。

关于python - 关于在 gensim 中如何实现 tf-idf 模型的一些困惑,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14705944/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com