gpt4 book ai didi

postgresql - PostgreSQL 是否使用 tf-idf?

转载 作者:行者123 更新时间:2023-11-29 11:28:58 25 4
gpt4 key购买 nike

我想知道在带有 GIN/GiST 索引的 PostgreSQL 9.3 中的全文搜索是否使用 tf-idf(词频-逆文档频率)。

特别是,在我的短语列中,我有一些更流行的词,而有些则非常独特(即名称)。我想为这些列编制索引,以便匹配的唯一词的权重高于常用词。

最佳答案

没有 Postgres 不使用 TF-IDF 作为文档之间的相似性度量。

ts_rank 如果文档包含更频繁的查询词则更高。它没有考虑术语的全局频率。

ts_rank_cd 如果文档包含更紧密且更频繁的查询词,则更高。它没有考虑术语的全局频率。

文本搜索创建者有一个名为 smlar 的扩展,这让您可以使用 TF-IDF 计算数组之间的相似性。它还允许您将 tsvectors 转换为数组,并支持快速索引。

关于postgresql - PostgreSQL 是否使用 tf-idf?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18296444/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com