gpt4 book ai didi

java - JSP 中的 UTF-8 URI 编码损坏

转载 作者:行者123 更新时间:2023-11-30 04:44:08 25 4
gpt4 key购买 nike

我遇到了 URI 编码错误的奇怪问题,希望得到任何帮助!

该项目使用 JSP、Servlet、Jquery、Tomcat 6。

JSP 中的字符集设置为 UTF-8,所有 Tomcat 连接器都使用 URIEncoding=UTF-8,并且我还使用字符编码过滤器,如 here 中所述。 。另外,我在元标记中设置了 contentType,并且我的浏览器可以正确检测到它。

在使用 Jquery 的 Ajax 调用中,我对要用作 URL 参数的术语使用encodeURIComponent(),然后使用 $.param() 序列化整个参数集。在被调用的 servlet 中,这些参数使用 Java.net.URLDecoder.decode(term, "UTF-8") 正确解码。

在某些地方,我从 JSP 中的参数映射生成 href 元素的 URL。每个参数值在 JSP 端均使用 Java.net.URLEncoder.encode(value, "UTF-8") 进行编码,但随后按照与之前相同的方式对其进行解码,从而导致特殊字符损坏。相反,我必须在 JSP 中将其编码为“ISO-8859-2”,然后在 servlet 中将其正确解码为“UTF-8”。

一个澄清的例子:术语“überfall”通过 Javascript (%C3%BCberfall) 进行 URIEncode 并发送到 servlet 进行解码和处理,这是有效的。将其传回 JSP 后,我会将其编码为 UTF-8 并构建 URL,结果如下:

<a href="/myWebapp/servletPath?term=%C3%BCberfall">Click here</a>

但是,单击此链接会将参数“%C3%83%C2%BCberfall”发送到 servlet,该 servlet 会解码为“Überfall”。当不进行编码时也会发生同样的情况。

当使用“ISO-8859-2”进行编码时,我得到:

<a href="/myWebapp/servletPath?term=%FCberfall">Click here</a>

单击此链接时,我可以在 Wireshark 中观察到 %C3%BCberfall 作为参数发送,该参数再次解码为“überfall”!

谁能告诉我我在哪里错过了什么?

编辑:在观察 Firebug 中的网络选项卡时,我意识到通过使用

$.param({term : encodeURIComponent(term)}); 

该术语采用 UTF-8 编码两次,结果为“%25C3%25BCberfall”,即百分号符号也是百分号编码的。类似地,如果我对参数映射中的每个值调用两次编码(术语,“UTF-8”),它对我有用。

编码一次并且不解码字符串会再次导致“Überfall”。

最佳答案

Java 内部使用什么编码?您是否开始申请

-Dfile.encoding=utf-8

请澄清“JSP 中的参数映射”的定义位置。它来自某些持久数据存储还是代码中以文字形式给出的字符串?

对正在发生的事情的一些想法可能会有所帮助:

ü 是读取 UTF-8 编码的 ü 并期待 ISO-8859-1 时出现的结果>,当每个字节单独解码时。 %C3%BCUTF-8 的两个 UTF-8 字节的 URI 编码表示形式 ü 。我认为这就是正在发生的事情:

%C3%BC错误地解码为 → Ñ编码为 → %C3%83%C2%BC ,然后再次解码为 → Ñ 这样你就结束了与überfall一起。

所以我猜,您使用了错误的编码来解码 URI 编码的字符串。这可能与 Java/JVM 使用的内部编码有关:

By default, the JRE 7 installer installs a European languages version if it recognizes that the host operating system only supports European languages.

关于java - JSP 中的 UTF-8 URI 编码损坏,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11505047/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com