gpt4 book ai didi

java - é在java中dom转换后显示为é

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:25:37 28 4
gpt4 key购买 nike

我正在尝试将 HTML 字符串转换为 dom 以进行一些 dom 级别的更改并将其转换回字符串。 HTML为法语,é等字符显示为é为转换后的String。

TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
DOMSource source = new DOMSource(doc);

String modifiedContent = "";
StringWriter writer = new StringWriter();
StreamResult result = new StreamResult(writer);
transformer.transform(source, result);
modifiedContent = writer.toString();

"Résultats de recherche"是一个字符串,dom转成String后,"Résultats de recherche"就是结果。

我将其提供给 FOP 处理器以将其转换为 pdf,因此我需要原始形式的字符。

最佳答案

在我看来,DOMSource 将字符保存为 html 格式很正常。

您或许可以使用 Jakarta library unescape html method将 html 字符转换回常规字符串。在你的情况下,你应该只添加这一行:

String unescapedHtml = StringEscapeUtils.unescapeHtml4(modifiedContent);

确保添加正确的 maven dependency到您的项目。

附言maven central 上似乎有更新版本的库,但我找不到相关的 javadoc。

关于java - é在java中dom转换后显示为é,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30094711/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com