- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
im目前正在开发一个系统,该系统可以在我们的网站上使用标签,im在如何最好和最有效地将标签存储在数据库中遇到了一些问题。设计需要进行设置,以便相对简单地检索符合搜索条件的帖子(比如在twitter上,当你点击一个标签的链接时,它会显示带有该标签的所有推文)。
这些标签将通过从创建的帖子(也可与twitter相比较)的内容中提取术语并插入它们来存储在db中。如何插入它们当然是手头的问题:
目前,我在两种可能的设计之间左右为难:
1)我的第一个设计理念(也许更传统)是三桌设计:
第一个表只存储post内容和其他相关数据
到帖子本身(我已经在使用这样的表格)。
第二个表只是存储正在使用的新标签,基本上起到了查找已使用的所有标签的作用。
第三个表是一个表,它定义了标签和post之间的关系。所以基本上是一个简单的表
将有一列的id为post,另一列的id为
我们存储在上一个表中的单个标签的ID。例如,一个有3个标签的post在这个表中有3行,每个标签对应一个标签。
2)第二种设计为双表设计:
与存储在其中的post数据相同的表,如上所示。
第二个表是第一个设计中的第二个和第三个表的混合:它保存标签和
posts,但不是将新的标签存储在分配它的表中
一个id,它只存储实际的标签(例如“test”)
以及邮政编码。同样的概念也适用于
如果post中有3个标签,它将在
桌子。
我之所以在各种想法之间纠结,是因为第一种选择似乎是更标准的方式,而且似乎有更多的“结构”。然而,由于它们是标签,我认为实际上给每个标签分配一个唯一的id并没有多大用处,因为标签不像类别或流派那样是真正的分类。
另外,当我尝试在搜索页面上搜索标签时,我必须使用较少的连接,因为我不需要查找搜索词的id,然后转到另一个表并找到具有该id的相关文章。
此外,当试图简单地列出一篇文章的标签时,有一件事可能会让人恼火,那就是标签的打印方式可能不同于用户在文章中设置的样式。因此,例如,如果一个用户添加了测试,但另一个用户先前输入了一个带有测试的帖子,那么该帖子的标签将打印出测试,因为这是保存在数据库查找表中的方式。当然,你可以区分大小写,但是在搜索中,测试和测试应该被认为是同一个标签,这样可能会变得混乱。还是我错了?有人对如何避免这种情况有什么建议吗?
另一方面,我对第二个表设计的担心是,我担心如果表变大,它可能会变得效率低下,因为查找字符串比搜索整数慢(我将在第一个设计中这样做)。然而,既然我在第一个设计中需要使用更多的连接,那么实际的性能会有差异吗?为了清楚起见,当搜索字符串本身时,我将使用=运算符而不是like。
类似地,如果我想查询标签本身,比如有多少帖子使用了某个标签之类的东西,我会想象第一个设计会更高效,尽管第二个设计也不是很困难,但我只是再次怀疑效率。
有什么能更好的工作吗?最重要的是,通过标签进行搜索是有效的,例如,我试图找到与它们相关联的测试的帖子。理想情况下,我还希望能够从数据库中检索post的标签,因为它是由用户在post内容中设置样式的。在这一点上,围绕分析标签的所有其他查询和函数都是次要的。
最佳答案
纯粹从数据库规范化的角度来看,您的第二个设计不会在3NF中。有一个原因,为什么你依赖于整个主要的,除了关键。如果哈希表中的任何更改对post表有直接影响,则会导致逻辑不一致。例如,标签表有两行:一行带有标签politics,另一行带有标签politic。假设为第二个标签创建帖子的人决定编辑他们的帖子并将其更新为政治标签(可能是因为他们打错了字)。你更新哪一行?
至于性能,我对第一个设计一点也不担心。你的数据库(就像现在几乎每个重要的关系数据库管理系统)都依赖一个叫做二进制搜索树的东西(或者更具体地说是“AA>”来优化你的数据库表中插入/删除/搜索的成本,当你正确地索引这些值时。它可以在一些文本搜索用例中使用o(1)(哈希表查找)进一步优化这个特性,或者甚至可以在一个键/值缓存存储中这样做,比如memcached/redis。在大多数情况下,索引哈希标签以创建使用这些标签的帖子的快速搜索绝对是您想要的设计。因为最大的成本因素不是查找单个标签(在这个用例中,我假设大多数搜索都有一个标签),而是检索包含该标签的所有帖子。
至于寻址查询的不区分大小写搜索部分,您的dbms很可能有一些排序规则选项,您可以在模式(如utf8_general_ci
)中指定,其中ci
表示模式中的不区分大小写比较。这意味着,数据将按原样存储,但是当在查询中与另一个值进行比较时,mysql将以不区分大小写的方式进行字符比较。
关于php - MySQL中主题标签的数据库设计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35283797/
我的问题是如何在 python 中创建一个简单的数据库。我的例子是: User = { 'Name' : {'Firstname', 'Lastname'}, 'Address' : {'Street
我需要创建一个与远程数据库链接的应用程序! mysql 是最好的解决方案吗? Sqlite 是唯一的本地解决方案吗? 我使用下面的方法,我想知道它是否是最好的方法! NSString *evento
给定两台 MySQL 服务器,一台本地,一台远程。两者都有一个包含表 bohica 的数据库 foobar。本地服务器定义了用户 'myadmin'@'%' 和 'myadmin'@'localhos
我有以下灵活的搜索查询 Select {vt:code},{vt:productcode},{vw:code},{vw:productcode} from {abcd AS vt JOIN wxyz
好吧,我的电脑开始运行有点缓慢,所以我重置了 Windows,保留了我的文件。因为我的大脑还没有打开,所以我忘记事先备份我的 MySQL 数据库。我仍然拥有所有原始文件,因此我实际上仍然拥有数据库,但
如何将我的 Access 数据库 (.accdb) 转换为 SQLite 数据库 (.sqlite)? 请,任何帮助将不胜感激。 最佳答案 1)如果要转换 db 的结构,则应使用任何 DB 建模工具:
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
我想在相同的 phonegap 应用程序中使用 android 数据库。 更多说明: 我创建了 phonegap 应用程序,但 phonegap 应用程序不支持服务,所以我们已经在 java 中为 a
Time Tracker function clock() { var mytime = new Date(); var seconds
我需要在现有项目上实现一些事件的显示。我无法更改数据库结构。 在我的 Controller 中,我(从 ajax 请求)传递了一个时间戳,并且我需要显示之前的 8 个事件。因此,如果时间戳是(转换后)
我有一个可以收集和显示各种测量值的产品(不会详细介绍)。正如人们所期望的那样,显示部分是一个数据库+建立在其之上的网站(使用 Symfony)。 但是,我们可能还会创建一个 API 来向第三方公开数据
我们将 SQL Server 从 Azure VM 迁移到 Azure SQL 数据库。 Azure VM 为 DS2_V2、2 核、7GB RAM、最大 6400 IOPS Azure SQL 数据
我正在开发一个使用 MongoDB 数据库的程序,但我想问在通过 Java 执行 SQL 时是否可以使用内部数据库进行测试,例如 H2? 最佳答案 你可以尝试使用Testcontainers Test
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 已关闭 9 年前。 此问题似乎与 a specific programming problem, a sof
我正在尝试使用 MSI 身份验证(无需用户名和密码)从 Azure 机器学习服务连接 Azure SQL 数据库。 我正在尝试在 Azure 机器学习服务上建立机器学习模型,目的是我需要数据,这就是我
我在我的 MySQL 数据库中使用这个查询来查找 my_column 不为空的所有行: SELECT * FROM my_table WHERE my_column != ""; 不幸的是,许多行在
我有那个基地:http://sqlfiddle.com/#!2/e5a24/2这是 WordPress 默认模式的简写。我已经删除了该示例不需要的字段。 如您所见,我的结果是“类别 1”的两倍。我喜欢
我有一张这样的 table : mysql> select * from users; +--------+----------+------------+-----------+ | userid
我有表: CREATE TABLE IF NOT EXISTS `category` ( `id` int(11) NOT NULL, `name` varchar(255) NOT NULL
我是一名优秀的程序员,十分优秀!