gpt4 book ai didi

Java 和 Unicode 的麻烦

转载 作者:行者123 更新时间:2023-12-02 02:38:52 26 4
gpt4 key购买 nike

我有一个 Java 程序,可以从 SQL-Server DB 中获取行并将同一行插入到 Informix DB 中。 Informix DB 仅支持 8859-1 字符集。有时,用户通过从 Word 或 Excel 复制和粘贴的方式在 SQL Server 数据库中插入一行,这会导致某些字符最终成为 Unicode 字符(其中一些字符大小为 3 字节)。

我如何编写一个过滤函数来替换 unicode 字符,例如用“?”或者其他什么?

/吉米

最佳答案

您可以用 替换所有非 ASCII 字符吗?:

StringBuilder buf = new StringBuilder();
for (char ch : originalString.toCharArray()) {
if (ch > 127) {
buf.append('?');
} else {
buf.append(ch);
}
}
return buf.toString();

另一种方法是使用正则表达式:

originalString.replaceAll("\\P{ASCII}", "?")

它将所有非 ASCII 字符替换为 ?

关于Java 和 Unicode 的麻烦,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45823814/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com