gpt4 book ai didi

java - 如何在 Java 中修剪字符串中的 Unicode\u0085 字符

转载 作者:行者123 更新时间:2023-12-01 14:36:48 26 4
gpt4 key购买 nike

我无法修剪 unicode 控制字符 \u0085在 java 。你怎么能做到这一点?

String str = "\u0000\u001f\u0085 hi \n"
PrintStream out = new PrintStream(System.out, true, "UTF-8");
out.println(teststr);
String st = teststr.replaceAll("\\p{Cntrl}", "");
out.println(st);

角色\u0085打印为?而且似乎没有被取代。

最佳答案

    import java.util.regex.Matcher;
import java.util.regex.Pattern;

public static String trimUtf16(String test) {
Pattern unicode = Pattern.compile("[^\\x00-\\x7F]",
Pattern.UNICODE_CASE | Pattern.CANON_EQ
| Pattern.CASE_INSENSITIVE);
Matcher matcher = unicode.matcher(test);
test = matcher.replaceAll(" ");
return test;
}
System.out.println(trimUtf16("\u0000\u001f\u0085 hi \n"));// hi

关于java - 如何在 Java 中修剪字符串中的 Unicode\u0085 字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16415868/

26 4 0