gpt4 book ai didi

elasticsearch - 获取文本字段中最常用的 10 个词

转载 作者:行者123 更新时间:2023-12-02 22:12:44 24 4
gpt4 key购买 nike

我有一个包含数千个文档的索引,每个文档都有一个完整的文本字段。

我想搜索所有这些字段并获取最常返回的 10 个最常见的词。

如果可能的话,我还想要一种在 Kibana 上可视化它的方法。

最佳答案

实现此目的的最常见方法是使用关键字数据类型 复制您的全文字段。这将使您能够对该字段进行术语聚合 - doc here .也许你可以考虑做一个 significant term aggregation - doc here ,从而避免出现停用词和常用词。在 ES 6.x 中,您还可以使用 significant text aggregation - doc here ,没有创建 keyword 字段,但我从未尝试过,我不知道它是如何工作的。相反,如果您需要检索每个文档的词频,您应该使用 termvector - doc here

关于elasticsearch - 获取文本字段中最常用的 10 个词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49792349/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com