gpt4 book ai didi

oracle - oracle 是否以特定的标准化形式存储 unicode 文本?

转载 作者:行者123 更新时间:2023-12-02 21:13:15 24 4
gpt4 key购买 nike

我想知道 Oracle Unicode 数据库是否以规范化形式存储数据,或者 Oracle 是否保证从查询返回的文本采用某种规范化形式。

这似乎是一个很容易回答的问题,但我在网上没有找到任何相关信息——这让我认为答案是否定的。有人有这方面的瘦身吗?

最佳答案

注意 Oracle 文档 Canonical Equivalence 的内容说:

Canonical equivalence is an attribute of a multilingual collation and describes how equivalent code point sequences are sorted. If canonical equivalence is applied in a particular multilingual collation, then canonically equivalent strings are treated as equal.

One Unicode code point can be equivalent to a sequence of base letter code points plus diacritic code points. This is called the Unicode canonical equivalence. For example, ä equals its base letter a and an umlaut. A linguistic flag, CANONICAL_EQUIVALENCE = TRUE, indicates that all canonical equivalence rules defined in Unicode need to be applied in a specific multilingual collation. Oracle Database-defined multilingual collations include the appropriate setting for the canonical equivalence flag. You can set the flag to FALSE to speed up the comparison and ordering functions if all the data is in its composed form.

因此,基本上,Oracle 有一个 CANONICAL_EQUIVALENCE 标志,您可以配置该标志来控制 Oracle 在排序过程中如何比较和考虑相同 Unicode 逻辑字符的分解/组合形式。

该标志的存在意味着 Oracle 在存储数据时不会自动规范化(组合或分解)Unicode 字符。如果 Oracle 在存储数据时确实自动执行规范化,那么使用该标志将是无意义且无用的。

关于oracle - oracle 是否以特定的标准化形式存储 unicode 文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32271053/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com