gpt4 book ai didi

数据库 - 数据版本控制(后续)

转载 作者:太空狗 更新时间:2023-10-30 01:51:30 25 4
gpt4 key购买 nike

我的原题可以查到here ,为此我得到了一些很好的答案、idas 和提示。

作为可行性和性能研究的一部分,我已经开始转换我的模式,以便使用这些想法对我的数据进行版本控制。在这样做的过程中,我想出了一些其他问题。

在我最初的问题中,我的示例很简单,没有真正的关系引用。为了保留我之前问题的示例,我现在将“名称”部分扩展到另一个表。

所以现在,我的数据变成了:

Person
------------------------------------------------
ID UINT NOT NULL,
NameID UINT NOT NULL,
DOB DATE NOT NULL,
Email VARCHAR(100) NOT NULL

PersonAudit
------------------------------------------------
ID UINT NOT NULL,
NameID UINT NOT NULL,
DOB DATE NOT NULL,
Email VARCHAR(100) NOT NULL,
UserID UINT NOT NULL, -- Who
PersonID UINT NOT NULL, -- What
AffectedOn DATE NOT NULL, -- When
Comment VARCHAR(500) NOT NULL -- Why

Name
------------------------------------------------
ID UINT NOT NULL,
FirstName VARCHAR(200) NOT NULL,
LastName VARCHAR(200) NOT NULL,
NickName VARCHAR(200) NOT NULL

NameAudit
------------------------------------------------
ID UINT NOT NULL,
FirstName VARCHAR(200) NOT NULL,
LastName VARCHAR(200) NOT NULL,
NickName VARCHAR(200) NOT NULL,
UserID UINT NOT NULL, -- Who
NameID UINT NOT NULL, -- What
AffectedOn DATE NOT NULL, -- When
Comment VARCHAR(500) NOT NULL -- Why

在 GUI 中,我们可以看到以下形式:

ID            :  89213483
First Name : Firsty
Last Name : Lasty
Nick Name : Nicky
Date of Birth : January 20th, 2005
Email Address : my.email@host.com

可以更改为:

  1. 仅限“姓名”部分
  2. 只针对“人”部分
  3. “姓名”和人物部分

如果出现“1”,我们将原始记录复制到 NameAudit 并使用更改更新我们的名称记录。由于对名称的人员引用仍然相同,因此不需要对 Person 或 PersonAudit 进行任何更改。

如果出现“2”,我们将原始记录复制到 PersonAudit 并使用更改更新 Person 记录。由于名称部分没有更改,因此不需要更改 Name 或 NameAudit。

如果出现'3',我们根据上述两种方法更新我们的数据库。

如果我们要对人员和姓名部分进行 100 次更改,那么当您稍后尝试显示更改历史记录时会出现一个问题。我的所有更改都显示了具有最新版本名称的人。这显然是错误的。

为了解决这个问题,Person 中的 NameID 字段似乎应该引用 NameAudit(但前提是 Name 发生了变化)。

正是这种条件逻辑开始使事情复杂化。

我很想知道以前是否有人在他们的数据库中遇到过此类问题,应用了什么样的解决方案?

最佳答案

您可能应该尝试阅读有关“时态数据库”处理的内容。你可以看的两本书是 Darwen、Date 和 Lorentzos“Temporal Data and the Relational Model”和(在一个完全不同的极端)“Developing Time-Oriented Database Applications in SQL”,Richard T. Snodgrass,Morgan Kaufmann Publishers, Inc.,旧金山,1999 年 7 月, 504+xxiii 页,ISBN 1-55860-436-7。这是绝版的,但可以在他的网站上以 PDF 格式获得,网址为 cs.arizona.edu。 .您还可以查找“Allen's Relations”的间隔 - 它们可能对您有所帮助。


我假设您数据库中的 DATE 类型包括时间(因此您可能使用 Oracle)。 SQL 标准类型可能是 TIMESTAMP,带有一些用于亚秒分辨率的小数位数。如果您的 DBMS 不包括带有 DATE 的时间,那么您将面临决定如何在一天内处理多个更改的难题。

您需要显示的大概是任一表中更改的历史记录,以及在进行更改时另一个表中有效的相应值。您还需要决定要显示的是前图还是后图;大概是后像。这意味着您将有一个“顺序”查询(Snodgrass 的术语),其中的列如下:

Start time        -- When this set of values became valid
End time -- When this set of values became invalid
PersonID -- Person.ID (or PersonAudit.ID) for Person data
NameID -- Name.ID (or NameAudit.ID) for Name data
DOB -- Date of Birth recorded while data was valid
Email -- Email address recorded while data was valid
FirstName -- FirstName recorded while data was valid
LastName -- LastName recorded while data was valid
NickName -- NickName recorded while data was valid

我假设一旦建立了 Person.ID,它就不会改变; Name.ID 同上。这意味着它们在记录有效时仍然有效。

其中一个困难的部分是建立正确的“开始时间”和“结束时间”值集,因为转换可能发生在任一表(或两者)中。目前,我什至不确定您是否拥有所需的所有数据。插入新记录时,您不会捕获它生效的时间(当您插入新记录时,XYZAudit 表中没有任何内容,是吗?)。


还有很多可以说的。不过,在进一步讨论之前,我希望就目前提出的一些问题获得一些反馈。


其他一些可能有帮助的 SO 问题:


由于这个答案是第一次写的,所以出版了另一本书,介绍了另一组用于处理时间数据的方法,称为“断言版本控制”。这本书是 ' Managing Time in Relational Databases: How to Design, Update and Query Temporal Data '汤姆约翰斯顿和兰德尔魏斯。您可以在 AssertedVersioning.com 找到他们的公司。 .当心:该机制可能存在专利问题。

此外,SQL 2011 标准(ISO/IEC 9075:2011,在许多部分中)已经发布。它包括一些时间数据支持。您可以在 TemporalData.com 上找到有关该问题以及与时态数据相关的其他问题的更多信息。 ,它更像是一个一般信息站点,而不是一个专门针对特定产品的站点。

关于数据库 - 数据版本控制(后续),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/908303/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com