gpt4 book ai didi

postgresql - 是否可以在 Postgres 中使用两个停用词词典?

转载 作者:行者123 更新时间:2023-11-29 11:44:29 25 4
gpt4 key购买 nike

我正在尝试获取列中出现频率最高的单词的列表。

SELECT
word,
sum(nentry) AS nentry
FROM ts_stat(
$$
SELECT to_tsvector('simple', body)
FROM document
$$
)
GROUP BY word

这工作得很好,但问题是文档包含法语和英语的单词。如果我使用英语词典查找停用词,我得到的最频繁的词是 pour,而当我使用法语词典时是 the。这两个词显然是我想排除的。

有没有办法创建一个使用两个不同词典作为停用词的配置?

最佳答案

您应该创建一个由法语和英语停用词文件联合而成的停用词文件,并使用该停用词文件创建一个简单字典。

然后创建一个文本搜索配置,将此字典用于 asciiwordword,并使用此配置。

关于postgresql - 是否可以在 Postgres 中使用两个停用词词典?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47677224/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com