gpt4 book ai didi

java - 使用 Java 在 Windows 中读取 UTF-8 格式的 xml 文件会出现 "IOException: Invalid byte 2 of 2-byte UTF-8 sequence."错误

转载 作者:行者123 更新时间:2023-12-01 17:36:43 29 4
gpt4 key购买 nike

我的 Java 程序有问题。我如何读取具有“UTF-8”编码的 xml 文件。程序在 Kubuntu 中运行正常,但在 Windows 中无法运行。两个操作系统都正确写入 xml 文件,但在 Windows 中解析时出现异常错误。

String XMLFile = "ÄÄKKÖSET.xml"
Document doc = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(new File (XMLFile));

这是我需要解析的 xml 文件:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<deck created="04/04/2011">
<title>ääkköset</title>
<code>ÄÄKKÖSET</code>
<description>ääkköset</description>
<author>ääkköset</author>
<cards nextCardID="1">
<card color="#1364F9" id="0">
<question>ÄÄKKÖSET</question>
<answer>ÄÄKKÖSET</answer>
</card>
</cards>
</deck>

如何在 Windows 中使用 Java 读取 xml 文件而不出现“IOException:2 字节 UTF-8 序列的无效字节 2”。 -错误?

提前致谢!

最佳答案

Invalid byte 2 of 2-byte UTF-8 sequence.

您的 XML 文档尚未保存为 UTF-8,解析器会检测到这一点(因为并非所有字节序列都是合法的 UTF-8)并抛出错误。

解决办法是将文件保存为UTF-8。将文档声明为 UTF-8 是不够的 - 数据编码的字节必须与此声明匹配。默认情况下,Windows 上的许多文本编辑器都会默认将数据保存为 ANSI。

关于java - 使用 Java 在 Windows 中读取 UTF-8 格式的 xml 文件会出现 "IOException: Invalid byte 2 of 2-byte UTF-8 sequence."错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5538845/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com