- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
‘combining characters’ 和有什么区别和 ‘grapheme extenders’在Unicode?
据我所知,它们似乎在做同样的事情——尽管字素扩展器的集合大于组合字符的集合。我显然在这里遗漏了一些东西。为什么要区分?
Unicode 标准,第 3 章,D52
最佳答案
实际使用上的区别在于,组合字符被定义为通用类别,用于字符的粗略分类,而字素扩展器主要用于UAX #29 text segmentation .
编辑:既然你提供了赏金,我可以详细说明一下。
组合字符是不能用作独立字符但必须与另一个字符组合的字符。它们用于定义组合字符序列。
Graphite 烯扩展器 introduced in Unicode 3.2用于 Unicode Technical Report #29: Text Boundaries (然后处于提议状态,现在称为 Unicode Standard Annex #29:Unicode Text Segmentation )。主要用途是定义字素簇。字素簇基本上是用户感知的字符。根据 UAX #29:
Grapheme cluster boundaries are important for collation, regular expressions, UI interactions (such as mouse selection, arrow key movement, backspacing), segmentation for vertical text, identification of boundaries for first-letter styling, and counting “character” positions within text.
关于unicode - Unicode 中的 ‘combining characters’ 和 ‘grapheme extenders’ 有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21722729/
在尝试反转字符串时,我找到了标题中提到的方法 即UnicodeSegmentation::graphemes 我引用了官方文档的用法,但是有两个不同的引用资料让我很困扰。 first一个有效,但 se
Unicode 指定 \X should match an "extened grapheme cluster" - 例如,一个基本字符后跟零个或多个组合字符。 (我相信这是一种简化,但可能足以满足我
这个字符串: [NSString stringWithFormat:@"%C%C%C%C", 0x31, 0x34f, 0x32, 0x20dd] 应该显示为 12,两个字符周围都有一个圆圈。 0x3
‘combining characters’ 和有什么区别和 ‘grapheme extenders’在Unicode? 据我所知,它们似乎在做同样的事情——尽管字素扩展器的集合大于组合字符的集合。我
Unicode 文本分割需要访问 Grapheme_Cluster_Break字符的属性。众所周知,JavaScript 没有以直接的方式提供。我希望我能够使用 Unicode property es
将 JavaScript 字符串拆分为“字符”可以轻松完成,但如果您关心 Unicode(并且您应该关心 Unicode),就会出现问题。 JavaScript native 将字符视为 16 位实体
我是一名优秀的程序员,十分优秀!