gpt4 book ai didi

java - 使用希伯来字符时出现 MalformedByteSequenceException : Invalid byte 1 of 1-byte UTF-8 sequence.

转载 作者:数据小太阳 更新时间:2023-10-29 02:03:59 25 4
gpt4 key购买 nike

我正在尝试解析包含希伯来字符的 XML 文件。我知道该文件是正确的,因为如果我(从不同的软件)输出没有希伯来语字符的文件,它解析得很好。

我尝试了很多方法,但总是出现这个错误

MalformedByteSequenceException: Invalid byte 1 of 1-byte UTF-8 sequence.

我最近的尝试是使用 FileInputStream 打开它并指定编码

DocumentBuilder db = dbf.newDocumentBuilder();
document = db.parse(new FileInputStream(new File(xmlFileName)), "Cp1252");

(Cp1252 是一种在不同应用程序中对我有用的编码)但我得到了相同的结果。

也尝试使用 ByteArray,但没有任何效果。

有什么建议吗?

最佳答案

如果您知道文件的正确编码并且它不是“utf-8”,那么您可以将它添加到 xml header 中:

<?xml version="1.0" encoding="[correct encoding here]" ?>

或将其解析为 Reader:

db.parse(new InputStreamReader(new FileInputStream(new File(xmlFileName)), "[correct encoding here]"));

关于java - 使用希伯来字符时出现 MalformedByteSequenceException : Invalid byte 1 of 1-byte UTF-8 sequence.,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13880937/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com