- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我有以下字符。
Ą¢¥ŞŠŞŤŹŽŻąľśšşťźžżÀÁÂÃÄÅÆÇÈÉÊÈÌÍÈÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâäåæçèêêëìíîïðñòóõþöüÌÚþÚÚ存在
我需要转换成
AcYSSSTZZZalssstzzzAAAAAAACEEEEIIIIDNOOOOOOUUUUYTSaaaaaaaceeeeeiiionooooooouuuuyty
我正在使用 Java 1.4。
Normalizer.decompose(text, true, 0).replaceAll( "\p{InCombiningDiacriticalMarks}+", "");仅用变音符号替换字符。
像 ¢¥ÆÐÞßæðøþ 这样的字符没有被转换。
我该怎么做,在 JDK 1.4 中进行转换的有效方法是什么。
请帮忙。
问候,斯里德维
最佳答案
查看 ICU project ,尤其是 icu4j 部分。Transliterator
类将解决您的问题。
这是一个 Transliterator
示例,它将任何脚本转换为拉丁字符并删除所有重音和非 ascii 字符:
Transliterator accentsConverter = Transliterator.getInstance("Any-Latin; NFD; [:M:] Remove; NFC; [^\\p{ASCII}] Remove");
Any-Latin
部分执行转换,NFD; [:M:] 移除; NFC
删除重音符号,[^\\p{ASCII}] Remove
删除所有剩余的非 ASCII 字符。
您只需调用 accentsConverter.transliterate(yourString)
即可获得结果。
您可以在 ICU Transformations guide 中阅读有关如何构建转换 ID(Transliterator.getInstance
的参数)的更多信息.
关于java - 在 Java 中将拉丁字符转换为普通文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10188575/
我对UDF pig 拉丁有问题。 我正在尝试实现一个系统,该系统必须验证本地存储的矩阵与hadoop存储库中存储的一组矩阵之间是否存在“映射”。 对于映射,我的意思是在hadoop中是否存在一个存储矩
数据库的排序规则用法是什么?好吧,对于 HTML UTF-8,我知道一点,比如显示其他语言类型。但是对于数据库呢?我正在使用 latin-1(默认),我的 friend 告诉我改用 UTF。当我问为什
我有以下带有架构的数据 (t0: chararray,t1: int,t2: int) (B,4,2) (A,2,3) (A,3,2) (B,2,2) (A,1,2) (B,1,2) 我想生成以下结果
我正在尝试构建 AOSP 拉丁 IME(源代码:https://android.googlesource.com/platform/packages/inputmethods/LatinIME/+/m
我正在实现过滤器功能。我使用以下方法定义字符串是否适合查询: someString.IndexOf(someSearch, StringComparison.OrdinalIgnoreCase) >=
我是一名优秀的程序员,十分优秀!