gpt4 book ai didi

twitter - Elasticsearch的索引标准

转载 作者:行者123 更新时间:2023-12-02 23:34:05 30 4
gpt4 key购买 nike

我正在使用Twitter流API。对于确定索引数据的标准有些困惑。现在,我有一个索引,其中包含一个doc_type中的所有推文和另一个文档类型的用户。

这是存储它们的最佳方法,还是我应该为每个类别创建一个新的文档类型(类别可以根据主题标签和tweet内容确定)

什么是存储此类数据的最佳方法?

提前致谢。

最佳答案

首先,您的问题的答案是,这很大程度上取决于您的用例。您的应用程序在做什么?您如何处理这些推文?您打算有几类?

但是,总的来说,我会寻找一种解决方案,其中对所有tweet使用相同的索引和相同的doc_type。这使您可以在所有推文上构建查询和汇总,而无需考虑类别的不同类型。它还使您可以轻松添加新类别,而无需更改查询。

如果要对推文进行某种分类,可以将类别字段添加到存储在elasticsearch中的推文文档中。然后,您可以使用此类别字段来实现您的特定应用程序逻辑。

如果您的类别名称带有空格或标点符号,请不要忘记将类别字段定义为not_analyzed。否则它将被分解成几部分。

关于twitter - Elasticsearch的索引标准,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33439590/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com