gpt4 book ai didi

java - 在 Java 中将损坏的字符转换为正确的值

转载 作者:搜寻专家 更新时间:2023-11-01 08:36:48 24 4
gpt4 key购买 nike

我目前正在读取外部 XML 文件。

在我正在从我的 Android 应用程序中读取的 RSS 提要中,撇号字符 ’ 呈现为 ’ 和 é(带重音符号的 e)表示为 É,该应用程序正在读取歌曲标题和音乐艺术家姓名。

我当前的代码从 XML 中读取,但原始 XML 文件在表示这些字符等方面存在问题。这并不总是发生,但我想弄清楚如何正确阅读它。我是从 Java 中更改 XML 的编码,还是有办法将这些类型的字符转换为它们应有的样子?

编辑:事实证明,以 UTF-8 格式查看 XML 页面可以正确呈现字符。有什么方法可以使用 Jsoup 库读取 UTF-8 编码的 XML 文档吗?

最佳答案

默认情况下,Jsoup 将使用 http header 中的 Content-Type 来呈现文件,但您可以显式地将编码类型传递给 Jsoup.parse () 方法如下:

Document document = Jsoup.parse(yourXML, "UTF-8");

关于java - 在 Java 中将损坏的字符转换为正确的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36109232/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com