gpt4 book ai didi

mysql - 在数据库中存储主题标签和用途/组合的最佳方式

转载 作者:搜寻专家 更新时间:2023-10-30 20:16:52 30 4
gpt4 key购买 nike

因此数据库中有大量主题标签(> 100.000)。

其他功能要求主题标签存储在按首字母排序的不同表中(tags_a、tags_b、...),但我认为可以忽略这一事实并将其作为解决方案的一个表来处理。

我现在想为标签的使用实现一个计数器。

所以我想我可以在这些表中显示一个列,并在每次使用标签时计算相应的值。

这样我就必须加入表格,例如获取前 100 个使用的标签...

有没有更聪明、更高效、更节省空间的方法来保存计数?

我的另一个需要是存储有关使用的标签组合的信息。

例如,用户正在使用标签“#a、#e、#k、#w”,我想知道#a 与#e 一起使用的频率 & #a 与 #k 和 #e 与#w 等等...

我想到的第一种方法是一个包含列的表:标记 1 (FK)、标记 2 (FK) 和计数,但这是一个 tag-count * tag-count long 的表。 . 没有更好的方法吗?

将来我希望有这样一种推荐:

  • 你用过#e,你可能还想用#k。

(其中#k 是与#e 最流行的组合之一)

或者类似垃圾邮件过滤器的东西,我在其中检查标签之间可能/通常的关系。

我如何才能以最高效和最节省空间的方式存储此类信息?

编辑

我预计每天会有多达 100 万个“帖子”,每个帖子最多可以有 10 个标签。

实际上这些不是帖子,但为了简单起见,我将这样调用它们。

重点是,将会有一种 AI 实现,它需要在相对较短的时间间隔内读取和学习这些以及许多其他存储的数据,还可以做其他事情,我们希望最大限度地减少尽可能多地处理和处理数据。

最佳答案

我将从设计数据库开始,以满足现实世界的需求。您有主题标签,这些标签与用户撰写的某种帖子相关。在我看来,这就像一个用户表、一个帖子表(带有用户的 FK)、一个标签表,以及一个帖子和标签之间的多对多链接表,具有适当的 FK。

如果你想知道一个主题标签被使用了多少次,那么只需查询表格即可。除非您要处理数百万(可能数百万)行的数据,否则使用适当的索引应该没问题。

一旦您实现了基本功能,如果测试表明(而不是预感)您将遇到性能问题,那么您可以进一步优化您的需求以处理该问题。

关于mysql - 在数据库中存储主题标签和用途/组合的最佳方式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35466950/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com