gpt4 book ai didi

elasticsearch - Elasticsearch中的快速关键词提取

转载 作者:行者123 更新时间:2023-12-02 22:33:38 25 4
gpt4 key购买 nike

我有一个存储在elasticsearch数据库中的图像批注的大型数据库。我想将此数据库用于关键字提取。输入是文本(通常是报纸文章)。我对算法的基本想法是浏览文章中的每个术语,并使用elasticsearch来发现该术语在图像注释中的出现频率。然后,从不常用的文章中输出术语(以使人或地点的名称优先于常见的英语单词)。

我不需要非常复杂的东西,这些关键字仅用作用户输入的建议,但是我想要更快的方法,然后向N个搜索查询(其中N是文本中的术语数)进行 flex 搜索,这对于大文本而言可能会很慢。在Elasticsearch中是否有一些健壮且快速的关键字提取技术?

最佳答案

您可以为此使用 flex 搜索term aggregations。他们可以返回带有文档计数的存储桶关键字,这些文档指示其相对频率。这是YML中的示例查询。

query:
match:
annotation:
query: text of your article
aggregations:
term_frequencies:
terms:
field: annotation

关于elasticsearch - Elasticsearch中的快速关键词提取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22171211/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com