gpt4 book ai didi

java - 在 java URI 中编码井号

转载 作者:搜寻专家 更新时间:2023-10-31 08:04:00 26 4
gpt4 key购买 nike

我有一个 java 程序,它应该从 URL 读取文件(URL 位置是 IIS 网站下的虚拟目录;在下面,在我的初始测试中,我像对待任何其他文件系统一样对待它地点)。不幸的是,所有需要读取的文件的路径在其中一个目录名称中包含井号 (#),我无法更改它。当(作为测试)我将程序指向路径中没有井号的位置时,该程序运行良好。

我首先根据传递给程序的字符串创建一个 URL。对于像 /Documents/#2012/09/11 这样的文件路径(其中 Documents 是 Windows 共享),如果我在命令行上将这样的路径传递给它,我可以让程序成功处理:

file://serverIPaddress/Documents/\%232012/09/07/16/DOC4671179.DOC

也就是说,井号被手动编码为 %23,并且反斜杠转义了 %23 的 %。

获取该 URL 只有一行:

URL url = new URL(filePath); // filePath is passed in

但是程序不会像那样被填入编码路径,所以我必须弄清楚如何以编程方式对井号进行编码。继续在 how to encode URL to avoid special characters in java 找到好的建议,我使用多参数构造函数创建了一个 URI(我将传递给程序的参数分解为三个单独的参数以适应该更改)。这是它的样子:

URI uri = new URI(protocol, host, filePath, null); // all values are passed in

正确编码井号;我的 URI 是:

file://serverIPaddress/Documents/%232012/09/07/16/DOC4671179.DOC

但是如果没有 %23 前面的反斜杠,程序会返回 Connection refused,大概是因为它在没有反斜杠的情况下误解了路径。

所以我想,好吧,我会自己添加反斜杠。我创建了相同的 URI,提取了它的 rawPath,并通过一些字符串操作,在 %23 前面放了一个反斜杠。然后,我使用该新字符串创建了一个新的 URI:

URI uri = new URI(protocol, host, filePath, null); // all values are passed in
String rawPath = uri.getRawPath();
int pctPos = rawPath.indexOf("%");
String escaped = new String("\\");
String firstPart = rawPath.substring(0,pctPos);
String secondPart = rawPath.substring(pctPos);
String newPath = firstPart + escaped + secondPart;
URI uri2 = new URI(protocol, host, newPath, null);

但是,不出所料,这给了我这样的 URI:

file://<serverIPaddress>/Documents/%5C%25232012/09/07/16/DOC4671179.DOC

同时使用反斜杠和 % 编码。有道理,但在执行时仍然不起作用。

URL API 说:

The URL class does not itself encode or decode any URL components according to the escaping mechanism defined in RFC2396. It is the responsibility of the caller to encode any fields, which need to be escaped prior to calling URL

所以我想,好吧,我将从上次尝试生成的新字符串创建一个 URL,而不是创建第二个 URI:

URI uri = new URI(protocol, host, filePath, null); // all values are passed in
String rawPath = uri.getRawPath();
int pctPos = rawPath.indexOf("%");
String escaped = new String("\\");
String firstPart = rawPath.substring(0,pctPos);
String secondPart = rawPath.substring(pctPos);
String newPath = firstPart + escaped + secondPart;
URL url = new URL(protocol + "://" + host + newPath);

但在那种方法中,即使我的新路径看起来不错:

/Documents/\%232012/09/07/16/DOC4671179.DOC

返回的 URL 为:

file://serverIPAddress/Documents//%232012/09/07/16/DOC4671179.DOC

在 %23 前面用一个额外的正斜杠代替反斜杠。

至此,我的想法已经用完了。

  • 是什么让最后一种方法中的反斜杠变成了 URL 中的正斜杠?

  • 我该怎么做才能获得我需要的 URI/URL?

  • 或者也许我应该问:为什么程序首先需要对 %23 中的 % 进行转义,如果 %23 是合法 URI 或 URL 的一部分,我能做些什么吗?怎么做?

最佳答案

不确定为什么需要“\”。这取决于服务器代码。实际上 "\"不是 URL 中的合法字符,它应该被编码为 %5C

URI 类非常困惑。它可能会默默地将文件 URL 的“\”更改为“/”。

试试这个:

    String filePath = "/Documents/#2012/09/11";
filePath = filePath.replace("#", "\\#");
URI uri = new URI("file", "serverAddress", filePath, null);

“#”将更改为“%5C%23”。看看它是否有效。

关于java - 在 java URI 中编码井号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12380229/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com