gpt4 book ai didi

android - 如何将 Shift-JIS 编码的字符串转换为 UTF-8?

转载 作者:行者123 更新时间:2023-11-30 03:00:31 24 4
gpt4 key购买 nike

我正在从 Aozora Bunko 获取 html 源代码. Html 文件是 Shift-JIS 编码的。我正在尝试获取书名和作者。然后我想将标题和作者记录到 SQLite(UTF-8) 数据库中。

    String[] splittedResult = result.split("\"title\">");
splittedResult = splittedResult[1].split("</h1>");
String title = splittedResult[0];
byte[] b = null;
try {
b = title.getBytes("Shift_JIS");
} catch (UnsupportedEncodingException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
String value=null;
try {
value = new String(b, "UTF-8");
} catch (UnsupportedEncodingException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}

...
myDatabase.addBookInformation(value, author);

结果是这样的:拉丁字母正常显示。但是日文字母在里面是用 block 问号显示的(请不要注意空值)

enter image description here

如何解决这个问题?

最佳答案

正如@Codo 所指出的,这个问题的解决方案是以前的。我改变了这个

s = EntityUtils.toString(response.getEntity(), "UTF-8");

对此

s = EntityUtils.toString(response.getEntity(), "Shift_JIS");

现在不需要编码了。

String[] splittedResult = result.split("\"title\">");
splittedResult = splittedResult[1].split("</h1>");
String title = splittedResult[0];
/** I HAVE TAKEN THIS PART OF MY CODE
byte[] b = null;
try {
b = title.getBytes("Shift_JIS");
} catch (UnsupportedEncodingException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
String value=null;
try {
value = new String(b, "UTF-8");
} catch (UnsupportedEncodingException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
**/

关于android - 如何将 Shift-JIS 编码的字符串转换为 UTF-8?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22619213/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com