gpt4 book ai didi

elasticsearch - ElasticSearch。索引中唯一词的总数

转载 作者:行者123 更新时间:2023-12-03 01:59:30 27 4
gpt4 key购买 nike

是否可以通过ES API访问索引中的术语总数?
我需要估计一个术语在索引中出现的先验概率:

total_term_frequency/total_terms_in_index

我可以访问 ttf,但索引中没有存储的术语总数。

最佳答案

我认为cardinality aggregation是您想要的。

例如:

POST /test_index/_search
{
"size": 0,
"aggs": {
"term_count": {
"cardinality": {
"field": "doc_text"
}
}
}
...
{
"took": 7,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 4,
"max_score": 0,
"hits": []
},
"aggregations": {
"term_count": {
"value": 161
}
}
}

这是我以前玩过的一些代码:

http://sense.qbox.io/gist/d5625c80946f332718b0fa166bba27efd264b76e

关于elasticsearch - ElasticSearch。索引中唯一词的总数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34002907/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com