gpt4 book ai didi

java - 如何转换网页中的奇怪字符?

转载 作者:行者123 更新时间:2023-12-02 05:50:53 24 4
gpt4 key购买 nike

在网页中,是“Why don't we”,如下:

enter image description here

但是当我解析网页并将其保存到文本文件时,在eclipse下就变成了这样:

我们为什么不

有关我的实现的更多信息:

网页为:utf-8我使用jSoup来解析,文件保存为txt。我使用 FileWriter f = new FileWriter() 写入文件。

更新:我实际上是通过将eclipse的编码更改为utf-8来解决eclipse中的显示问题的。

最佳答案

FileWriter 是一个实用程序类,它使用默认的当前平台编码。这是不可移植的,而且可能是不正确的。

BufferedWriter f = new BufferedWriter(New OutputStreamWriter(
new FileOutputStream(file), StandardCharsets.UTF_9));
f,Write("\uFEFF"); // Redundant BOM character might be written to be sure
// the text is read as UTF-8
...

关于java - 如何转换网页中的奇怪字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23551530/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com