gpt4 book ai didi

java - JSoup 不能很好地清理非 ASCII 字符串

转载 作者:行者123 更新时间:2023-12-01 15:12:48 25 4
gpt4 key购买 nike

我正在使用 JSoup 来清理用户传入的文本。唉,它似乎不支持非 ASCII 字符进行清理:

assertEquals("привет", Jsoup.clean("привет", Whitelist.none()));

这不起作用。

有什么想法吗?

最佳答案

如果您运行代码,默认编码是什么?也许这不是UTF-8,而是linux/windows默认的。您可以使用VM参数-Dfile.encoding=UTF8来确保UTF-8。

也用 jsoup 1.6.3 检查了你的代码 --> 测试成功

关于java - JSoup 不能很好地清理非 ASCII 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12097611/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com