gpt4 book ai didi

sql - 我应该如何对数据库中的数据准确性/置信度建模?

转载 作者:行者123 更新时间:2023-12-04 15:25:19 30 4
gpt4 key购买 nike

假设我有一个包含时间戳的数据库。对于每个时间戳属性,我可能会添加一个准确度属性,说明置信区间,因此存储的信息可能是,例如,“2012 年 7 月 1 日 12:13,+/- 3 个月”。

但总的来说,记录准确性/置信度并不是那么简单。家谱数据库可能需要记录一个人可能是另一个人的父亲这一事实。

那么,在存储具有不同准确性/置信度的信息方面是否有任何一般原则或最佳实践?

最佳答案

以你父亲为例,这很容易;不可能超过 100% 地确信某人是其他人的父亲;一般来说,不可能对任何事情有超过 100% 的信心!这反过来意味着对于所有内容,您可以简单地存储任何数据属性的百分比置信水平。

但是,您可能不想将置信水平存储为百分比;它取决于数据属性本身以及数据的含义。

例如,如果您想存储特定字符串与另一个字符串相比的“准确度”,您可能想要存储 Levenshtein distance反而。在您的时间戳示例中,我个人会存储最小值和最大值,但您也可以存储要添加或减去的月数;要么可以快速计算数据库中的选择。

我试图写的可能不清楚的是,您的问题的答案不取决于数据库,而是取决于其中的数据以及您的用户、业务等的需求。因为它取决于数据,每个单独的属性或列需要单独的解决方案;不可能有一个“通用”的解决方案。

关于sql - 我应该如何对数据库中的数据准确性/置信度建模?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11281468/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com