gpt4 book ai didi

java - 如何用 Jsoup 去除硬空间?

转载 作者:搜寻专家 更新时间:2023-10-30 19:53:05 26 4
gpt4 key购买 nike

我正在尝试删除硬空格(从 HTML 中的   实体)。我无法使用 .trim().replace("", "") 等删除它!我不明白。

我什至在 Stackoverflow 上发现尝试使用 \\u00a0 但都没有用。

我试过这个(因为 text() 返回实际的硬空格字符,U+00A0):

System.out.println( "'"+fields.get(6).text().replace("\\u00a0", "")+"'" ); //'94,00 '
System.out.println( "'"+fields.get(6).text().replace(" ", "")+"'" ); //'94,00 '
System.out.println( "'"+fields.get(6).text().trim()+"'"); //'94,00 '
System.out.println( "'"+fields.get(6).html().replace(" ", "")+"'"); //'94,00' works

但我不明白为什么我不能用.text() 删除空白。

最佳答案

您的第一次尝试非常接近,您说得很对,Jsoup 将   映射到 U+00A0。您只是不想在字符串中使用双反斜杠:

System.out.println( "'"+fields.get(6).text().replace("\u00a0", "")+"'" ); //'94,00'
// Just one ------------------------------------------^

replace 不使用正则表达式,因此您不会尝试将文字反斜杠传递到正则表达式级别。您只想在字符串中指定字符 U+00A0。

关于java - 如何用 Jsoup 去除硬空间?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21137892/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com