- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
在我的应用程序中,我有一些字符后跟它们的“修饰变音符号”(例如“o^”,其中“^”是 unicode 0x02c6),我想将其转换为完全预组合的字符(例如“ô”-统一码 0x00f4)。我尝试使用 NSString 方法 precomposedStringWithCanonicalMapping,但在我用头撞墙试图找出它不起作用的原因几个小时后,我发现它只能将“组合变音标记”(http://www.unicode.org/charts/PDF/U0300.pdf)转换为预组合字符。好的,所以我需要做的就是将我所有的“修饰符变音符”转换为“组合变音符”,然后对生成的字符串执行预组合的 StringWithCanonicalMapping,我就完成了。这确实有效,但我想知道是否有更简单/更容易出错的方法来做到这一点?这是我的 NSString 类别方法,它似乎可以修复大多数字符-
- (instancetype)combineDiacritics
{
static NSDictionary<NSNumber *, NSNumber *> *sDiacriticalSubstDict; //unichar of diacritic -> unichar of combining diacritic
static dispatch_once_t onceToken;
dispatch_once(&onceToken, ^{
//http://www.unicode.org/charts/PDF/U0300.pdf
sDiacriticalSubstDict = @{ @(0x02cb) : @(0x0300), @(0x00b4) : @(0x0301), @(0x02c6) : @(0x0302), @(0x02dc) : @(0x0303), @(0x02c9) : @(0x0304), //Grave, Acute, Circumflex, Tilde, Macron
@(0x00af) : @(0x0305), @(0x02d8) : @(0x0306), @(0x02d9) : @(0x0307), @(0x00a8) : @(0x0308), @(0x02c0) : @(0x0309), //Overline, Breve, Dot above, Diaeresis
@(0x00b0) : @(0x030a), @(0x02da) : @(0x030b), @(0x02c7) : @(0x030c), @(0x02c8) : @(0x030d), @(0x02bb) : @(0x0312), //Ring above, Double Acute, Caron, Vertical line above, Cedilla above
@(0x02bc) : @(0x0313), @(0x02bd) : @(0x0314), @(0x02b2) : @(0x0321), @(0x02d4) : @(0x0323), @(0x02b1) : @(0x0324), //Comma above, Reversed comma above, Palatalized hook below, Dot below, Diaeresis below
@(0x00b8) : @(0x0327), @(0x02db) : @(0x0328), @(0x02cc) : @(0x0329), @(0x02b7) : @(0x032b), @(0x02cd) : @(0x0331), //Cedilla, Ogonek, Vert line below, Inverted double arch below, Macron below
};
});
NSMutableString* __block buffer = [NSMutableString stringWithCapacity:self.length];
[self enumerateSubstringsInRange:NSMakeRange(0, self.length) options:NSStringEnumerationByComposedCharacterSequences usingBlock: ^(NSString* substring, NSRange substringRange, NSRange enclosingRange, BOOL* stop) {
NSString *newString = nil;
if (substring.length == 1) //The diacriticals are all Unicode BMP.
{
unichar uniChar = [substring characterAtIndex:0];
unichar newUniChar = [sDiacriticalSubstDict[@(uniChar)] integerValue];
if (newUniChar != 0)
{
NSLog(@"Unichar %04x => %04x", uniChar, newUniChar);
newString = [NSString stringWithCharacters:&newUniChar length:1];
}
}
if (newString)
[buffer appendString:newString];
else
[buffer appendString:substring];
}];
NSString *precomposedStr = [buffer precomposedStringWithCanonicalMapping];
return precomposedStr;
}
有人知道进行这种转换的更多内置方法吗?
最佳答案
没有内置的方法来进行这种转换,因为间距修饰符字母 block (U+02B0
..U+02FF
) 中的字符不打算用作变音符号。来自 Unicode 标准的第 7.8 节:
They are not formally combining marks (gc=Mn or gc=Mc) and do not graphically combine with the base letter that they modify. They are base characters in their own right.
Spacing Clones of Diacritics. Some corporate standards explicitly specify spacing and nonspacing forms of combining diacritical marks, and the Unicode Standard provides matching codes for these interpretations when practical.
如果您想将它们转换为组合形式,您将需要从 Spacing Modifier Letters code chart 中的交叉引用构建一个表(正如您已经在做的那样) .
关于objective-c - 如何在 iOS 上转换为 "combining diacritical marks",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35952216/
我需要一个可以显示每个主题的最高分数计数的查询。假设 3 名学生的科学成绩需要达到 98 分 count marks subject 3 98 Maths 最佳答案 首先找到每个
对于Java中的Concurrent-Mark-Sweep垃圾收集器;我不清楚这两个阶段有什么不同。为什么需要并发标记?初始标记没有找到所有 Activity 对象吗? 最佳答案 使用CMS,即所谓的
我想知道组查询的工作 假设有一张表Student(id,name,marks) 现在如果我想输出除得分最高的学生之外的所有学生,为什么这个查询不起作用? SELECT * FROM Students
我在 VSCode 中使用 markdown 预览器,希望能够突出显示“.md”文件中的某些文本并将其包装在“”标签中,以便在查看 markdown 文件时突出显示以其呈现的格式。 有没有快速简便的方
Pragma 标记在 Localizable.strings 文件中不起作用。如果我在 Localizable.strings 中添加第二个 MARK: (#pragma mark),xcode 会出
我喜欢使用 vim(在 ms windows 上),我想每个人都有一个最喜欢的编辑器,这是我的。 在一台特定的 PC 上,我遇到了与 mark[a-zA-Z] 命令有关的问题。它不适用于字母 a 和
import java.util.*; public class loops { public static void main (String []args) { Scann
我喜欢使用 vim(在 ms windows 上),我想每个人都有一个最喜欢的编辑器,这是我的。 在一台特定的 PC 上,我遇到了与 mark[a-zA-Z] 命令有关的问题。它不适用于字母 a 和
假设我有一个包含函数的列表:。如果我想使用BASCH对它们进行基准测试,我可以这样做:。它运行得很好。然而,我对这种方法有两个小毛病。。看来,Exprs对Mark的论证应该会有所帮助,因为它允许我做一
我正在编写我的 k8s 升级 ansible 剧本,其中我需要做 apt-mark unhold kubeadm .现在,我试图避免使用 ansible command或 shell调用模块apt如果
我的 View 区域中有 2 个并排的列表控件。当我在 list1 中选择一个项目时,会填充 list2。当在 list2 中选择一个项目时,详细信息会显示在它之外的另一个 View 中。 因此,当在
目标是用括号标记字符串中的每个匹配项,并为每个匹配项标记返回相同的字符串 即: Pattern = "\\d+" Text = "e3e3e" wanted result = "e(3)e(3)e"
在我通过启动并运行一个 100% 覆盖率的小型 C++ 测试项目来了解更多关于自动化测试的过程中,我遇到了以下问题——尽管我所有的实际代码行和所有执行分支都是被测试覆盖,lcov 仍然报告两行未经测试
我实现了一个小函数,它解析 SQL INSERT 语句并在光标位于列名上时突出显示列值,反之亦然。 然后我想添加一种在列名和列值之间快速跳转的可能性。我在我的实现中使用了 push-mark,所以我可
我有一个变量searchString与包含字符串。我必须列出 titles我想要的过滤器 searchString 。我尝试使用标签 用于突出显示一段标题,但目前还无法做到。 我尝试实现一个具有 2
我在使用 AppCode IdeaVim 插件时遇到了这个奇怪的问题。安装后一切似乎都正常工作。然而我遇到了一些非常烦人的事情。每当我尝试通过运行 :marks 命令或 :registers 列出标记
这是一个关于正确实现Java的InputStream接口(interface)的问题。 我的实现不支持标记/重置功能。因此,它从 markSupported 方法返回 false。在这种情况下我应该如
我正在构建我的第一个 Tailwindcss基于网站。我想修改 标签使标记的文本看起来更漂亮。 这是我做的: mark { @apply inline-block pr-1 pl-1 py-0
我看到默认的 背景颜色为黄色。在哪里定义的? 我没有在 reference 中找到它,CSS2 system colors中没有对应的颜色. 颜色总是一样的吗?它取决于浏览器或 GUI 设置吗?有什么
我无法想出正确的正则表达式字符串来删除多个 ?人物。我想按顺序更换多个?用一个 ?,但是要转义哪些字符...正在转义我。 示例输入: Is this thing on??? or what??? 期望
我是一名优秀的程序员,十分优秀!