gpt4 book ai didi

java - 标准化除 ñ 以外的字符串

转载 作者:塔克拉玛干 更新时间:2023-11-01 23:08:08 25 4
gpt4 key购买 nike

我有以下示例代码:

String n = "Péña";
n = Normalizer.normalize(n, Normalizer.Form.NFC);

如何规范化字符串 n 除了 ñ

不仅是那个字符串,我正在制作一个表格,我想只保留 ñ's,其他所有内容都没有变音符号。

最佳答案

用不可打印字符“\001”替换所有出现的“ñ”,因此“Péña”变为“Pé\001a”。然后调用 Normalizer.normalize() 将“é”分解为“e”和一个单独的变音符号。最后删除变音符,并将不可打印字符转换回“ñ”。

String partiallyNormalize(String string)
{
string = string.replace('ñ', '\001');
string = Normalizer.normalize(string, Normalizer.Form.NFD);
string = string.replaceAll("[\\p{InCombiningDiacriticalMarks}]", "");
string = string.replace('\001', 'ñ');
return string;
}

您可能还想为 Easy way to remove UTF-8 accents from a string? 的首选答案投票,我在那里学习了如何删除变音符号。

关于java - 标准化除 ñ 以外的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36098063/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com