- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在提出我的问题(基本上就是标题所说的)之前,我想提供一些背景知识,以便更好地了解我的情况。
我正在用 Java 编写一个小应用程序,主要用于学术目的,但也考虑到一个非常具体的任务。该应用程序的作用基本上是从基本 URL 开始构建 URL 层次结构,然后提供组织链接并对链接执行某些操作的能力。
想象一下以下 URL:
http://www.example.com
http://www.example.com/sub001
http://www.example.com/sub002
http://www.example.com/sub002/ultrasub
我希望我的程序在提供基本 URL http://www.example.com
时检索此层次结构(或http://www.example.com/
)。
在我的代码中,我有一个能够对 URL 进行编码的类,并且我已经想到了一种验证它们的方法,但我只是找不到一种方法来找出基本 URL 下的 URL 层次结构。
是否有直接的方法,或者我只需从基本 URL 下载文件并开始从文件中存在的相对和绝对链接构建层次结构?
我并不是要求具体的代码,只是对我可以采取的方式进行(某种程度上)完整的解释,也许还有一些框架代码来指导我。
此外,我将 URL 存储在 TreeMap<URL,Boolean>
中结构,其中Boolean
说明 URL 是否已被分析。我在快速浏览了 Java 7 API 规范后选择了这个结构,但是您是否建议任何更适合此特定目的的结构?
提前致谢:)
最佳答案
HTTP 协议(protocol)中无法请求给定 URL“下”的所有 URL。你运气不好。
一些协议(protocol)(例如 ftp://...)确实有明确的机制......
如果您请求“目录”,某些 HTTP 服务器将打印索引页,但不建议这样做,而且没有多少服务器会这样做。
底线是您必须跟踪链接才能确定服务器层次结构是什么,即使这样您也可能找不到指向层次结构所有区域的链接。
编辑:我要补充的是,作为一个行为良好的网民,您应该遵守 robots.txt文件存储在您访问的任何服务器上......
EDIT2:(在对 FTP 机制进行评论之后)FTP协议(protocol)有很多命令:See this wiki list 。命令之一是:NLIST
其中“返回指定目录中的文件名列表。”URL specification对 FTP 协议(protocol) URL 的 URL 格式做了特殊规定,在第 3.2.2 节中:
The url-path of a FTP URL has the following syntax:
<cwd1>/<cwd2>/.../<cwdN>/<name>;type=<typecode>
....
If the typecode is "d", perform a NLST (name list) command with as the argument, and interpret the results as a file directory listing.
当我从命令行(而不是从浏览器)尝试此操作时,我可以看到效果:
rolf@home ~ $ curl 'ftp://sunsite.unc.edu/README'
Welcome to ftp.ibiblio.org, the public ftp server of ibiblio.org. We
hope you find what you're looking for.
If you have any problems or questions, please see
http://www.ibiblio.org/help/
Thanks!
和type=d
我得到:
rolfl@home ~ $ curl 'ftp://sunsite.unc.edu/README;type=d'
HEADER.images
incoming
HEADER.html
pub
unc
README
关于java - 从基本链接获取 URL 层次结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19794220/
我正在尝试将多个水平链接的 Button 和 TextView 垂直链接为 View 集,但仍保持平面 View 层次结构。这是我的初始布局和代码:
到目前为止,我已经在Google BigQuery上训练了几种模型,目前我需要查看模型的外观(即架构,损失函数等)。 有没有办法获取这些信息? 最佳答案 仔细阅读文档后,我可以说该功能尚不存在。我什至
本文实例讲述了PHP实现二叉树深度优先遍历(前序、中序、后序)和广度优先遍历(层次)。分享给大家供大家参考,具体如下: 前言: 深度优先遍历:对每一个可能的分支路径深入到不能再深入为止,而且每个
我是一名优秀的程序员,十分优秀!