gpt4 book ai didi

java - 我怎样才能解码中文

转载 作者:行者123 更新时间:2023-11-30 11:40:59 25 4
gpt4 key购买 nike

我正要开始解码一些我确定是中文的东西,它在数据库中看起来像这样:

Sybase默认编码是windows-1252,但是上面是什么?我怎样才能解码它来写出中文字符。不幸的是,它存储为 nchar。

如果有人想知道它是这样完成的:

int i = new Integer("34913").intValue();

String s = new String(Character.toChars(i));

正如@Joachim 所说,谢谢。

最佳答案

这是 a decimal numeric character reference as defined by XML (以及 HTML4HTML5 )。该数字是 Unicode 代码点的十进制表示。

简单地解析数字并将其转换为 int 以获得实际的 unicode 代码点。然后使用 Character.toChars()获取相应的 char 值(通常只有一个,但对于 the BMP 之外的字符,将有两个替代值)。

关于java - 我怎样才能解码中文,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12457481/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com