gpt4 book ai didi

database-design - 如何设计一个存储在现实世界中可以重复的名称数据的表?

转载 作者:行者123 更新时间:2023-12-01 09:33:53 30 4
gpt4 key购买 nike

我正在寻找对我们的数据库设计师提出挑战的设计难题的方向。我搜索了文件和谷歌并没有得出任何结论,但我怀疑这是一个简单/新手类型的问题。

我们有一个存储事件位置的表。它被称为位置表。该表要求 LocationCode 是唯一的。该表还要求 LocationName 是唯一的。然而,在现实世界中,有时两个地点虽然存在于不同的地方,但名称相同(例如,两所同名的学校存在于同一州的不同县)。一位设计师坚持认为应该通过在名称上附加一个值来强制名称不同,例如县名(例如联合高中 - 弗朗西斯县)。她这样做的理由是确保“受控词汇”。另一位设计师坚持应该允许名称相同,因为这反射(reflect)了现实,并且应该使用 LocationCodes 来强制/跟踪唯一性。

我倾向于第二位设计师的方向——名称应该允许不同。我能想到的一个可比较的例子是人们经常使用相同的名字(例如 Jane Doe)。在存储有关人员的联系信息的表中,似乎不会强制要求姓名不同,而社会保障代码将完成跟踪唯一性的工作。

那么对于这个问题是否有一般的指导方针或标准?指向有用文档的链接会很棒。提前致谢。

最佳答案

I'm leaning in the direction of the second designer -- the names should be allowed to be different.

我认为您的意思是说您认为应该允许名称相同,您的表应该允许重复名称。

In a table that stores contact information about people, it would seem the names wouldn't be forced to be different and a social security code would do the job of tracking uniqueness.

虽然在简单的情况下确实如此,但在实际应用中您会发现

  • 一些居住在美国的外国人没有 SSAN,
  • SSANs have duplicates ,合法的和非法的,并且
  • 一些美国公民没有 SSAN。 (通常是因为出生在医院以外的地方。)

明确识别人员既是一个难题,也是一个依赖于应用程序的问题。本地机动车管理局有其识别人员的方法;美国国税局有的方法;雇主有自己的方式;学校和医院有自己的方式(隐私法在这里有很大的影响)。您可能需要找到自己的方式。

这是您无法避免的:在某些时候,您公司的某个人必须能够分辨出许多数据库行中写着“John Smith”的哪一行与您办公 table 前愤怒的客户相匹配。

我会这样看位置名称。 “旧金山”的全称是“美国加利福尼亚州旧金山”。全名很容易区分“克林顿小姐”。来自“爱荷华州克林顿”。

我发现两个不同的地方具有相同的非正式名称。例如,可能有一个名为“田纳西州天然桥”的小镇,而田纳西州的另一个地方一座天然桥,也称为“田纳西州天然桥”。不同之处在于,其中一个地方总是一座城市,而另一个地方则不是。 (至少根据我的经验。发现异常我不会感到惊讶。)

然而,这些现实世界的问题是否对很重要,这取决于应用程序。我不必处理不是城市的地名,因此存储“全名”是一种简单直接的方式来确保良好的数据。

在您的情况下,对于事件地点,我认为允许重复名称在商业意义上是不切实际的。如果名称重复,您基本上需要人们记住哪个位置代码指的是每个真实世界的位置,并给出其名称作为提示。对于任何显着规模的数据库,无论如何,人们都无法可靠地不写下差异

关于database-design - 如何设计一个存储在现实世界中可以重复的名称数据的表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11886657/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com