gpt4 book ai didi

java - 将 UTF-8 Unicode 字符串转换为 ASCII Unicode 转义字符串

转载 作者:行者123 更新时间:2023-11-29 07:43:10 24 4
gpt4 key购买 nike

我需要将 unicode 字符串转换为具有以 unicode 编码的非 ascii 字符的字符串。例如,字符串“汉字 Max”应显示为“\u6F22\u5B57 Max”。

我尝试过的:

  1. 不同的组合

    新字符串(sourceString.getBytes(encoding1), encoding2)

  2. Apache StringEscapeUtils 也转义双引号等 ascii 字符

    StringEscapeUtils.escapeJava(源码)

有没有简单的方法来编码这样的字符串?理想情况下,应仅使用 Java 6 SE 或 Apache Commons 来实现预期结果。

最佳答案

这是 Jon Skeet 在他的评论中想到的那种简单代码:

final String in = "šđčćasdf";
final StringBuilder out = new StringBuilder();
for (int i = 0; i < in.length(); i++) {
final char ch = in.charAt(i);
if (ch <= 127) out.append(ch);
else out.append("\\u").append(String.format("%04x", (int)ch));
}
System.out.println(out.toString());

正如 Jon 所说,代理对将表示为一对 \u 转义符。

关于java - 将 UTF-8 Unicode 字符串转换为 ASCII Unicode 转义字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28176578/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com