gpt4 book ai didi

lucene - Lucene。如何建立术语文档矩阵

转载 作者:行者123 更新时间:2023-12-02 04:11:44 27 4
gpt4 key购买 nike

我需要建立该矩阵,但找不到用于为每个单元格计算归一化tf-idf的方法。
我要执行的归一化是余弦归一化,将tf-idf(使用DefaultSimilarity计算)除以1 / sqrt(列中的sumOfSquaredtf-idf)。

有谁知道执行此操作的方法?
提前致谢
安东尼奥

最佳答案

Sujit Pal's blog描述了一种不使用Lucene的方法。另外,您可以构建一个Lucene索引,该索引具有每个字段的术语 vector ,对术语进行迭代以获得idf,然后对术语的文档进行迭代以获得tf。

关于lucene - Lucene。如何建立术语文档矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4756377/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com