gpt4 book ai didi

postgresql - Postgres 和词云

转载 作者:行者123 更新时间:2023-11-29 12:00:39 25 4
gpt4 key购买 nike

我想知道是否可以创建一个 Postgres 函数来扫描一些表行并创建一个包含 WORDAMOUNT(频率)的表?我的目标是使用此表创建词云。

最佳答案

有一个简单的方法,但它可能很慢(取决于您的表大小)。您可以将文本拆分为一个数组:

SELECT string_to_array(lower(words), ' ') FROM table;

对于这些数组,您可以使用 unnest 来聚合它们:

WITH words AS (
SELECT unnest(string_to_array(lower(words), ' ')) AS word
FROM table
)
SELECT word, count(*) FROM words
GROUP BY word;

这是一种简单的方法,但存在一些问题,例如,它仅按空格而不是标点符号拆分单词。

其他,可能更好的选择,是使用PostgreSQL full text search .

关于postgresql - Postgres 和词云,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14957483/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com