gpt4 book ai didi

normalization - "normalizing"和 "canonicalizing"数据之间是否存在明确的区别?

转载 作者:行者123 更新时间:2023-12-04 11:31:18 28 4
gpt4 key购买 nike

我理解规范化和规范化意味着删除数据表示中任何无意义或模棱两可的部分,将有效相同的数据转换为实际相同的数据。

例如,如果您想获取某些输入数据的哈希值,并且其他任何人对规范的相同数据进行哈希处理都获得相同的哈希值很重要,那么您不希望一个文件使用制表符缩进而另一个使用空格(并且没有其他区别) ) 导致两个截然不同的哈希值。

在 JSON 的情况下:

  • 对象属性将按标准顺序(可能按字母顺序)放置
  • 不必要的空格将被删除
  • 缩进标准化或剥离
  • 数据甚至可以用全新的语法重新建模,以强制执行上述

  • 我的定义是否正确,并且这些术语可以互换?或者 之间是否存在明确定义和具体的区别?规范化 标准化 输入数据?

    最佳答案

    “规范化”和“规范化”(来自“规范(形式)”和“规范形式”)是两个相关的通用数学术语,根据那里给出的某些确切含义,它们在特定上下文中也有特定用途。当一般含义适用时,用这些术语中的一个来标记特定过程是合理的。

    你对这些特定用途的描述是模糊的。一般和特殊情况的正式含义更有用。

    有时,给定一堆事物,我们将它们(全部)划分为(不相交的)组,也就是等价类,我们认为在某些特定意义上相似或相同,也就是等价的那些。根据某些特定的 equivalence relation,组/类的成员是相同/等效的.

    我们从每个组/类(class)中挑选一个特定的成员作为代表,并将其称为该组及其成员的规范形式。当两个事物在同一个等价类中时,它们是完全等价的。当两个事物的规范形式相等时,它们完全相等。

    范式可能是规范形式,也可能只是几个杰出成员中的一个。

    规范化/规范化是查找或使用事物的规范/规范形式。

    Canonical form .

    The distinction between "canonical" and "normal" forms varies by subfield. In most fields, a canonical form specifies a unique representation for every object, while a normal form simply specifies its form, without the requirement of uniqueness.



    将定义应用于您的示例:您是否有一堆要分区的值?您是否为每个类选择一些成员而不是该类的其他成员?好吧,您有 JSON 值,并且没有重新建模它们,您将根据它们在函数下映射到的同一类成员对它们进行分区。因此,您可以合理地将结果 JSON 值称为输入的规范形式。如果您将重新建模描述为适用于所有输入,那么您还可以合理地将这些规范值的重新建模后形式称为重新建模输入值的规范形式。但如果不是,那么人们可能不会提示您将重新建模的值称为输入值的规范形式,即使从技术上讲它们不会。

    关于normalization - "normalizing"和 "canonicalizing"数据之间是否存在明确的区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55286086/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com