- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试获取与 HTMLunit 的连接列表。到目前为止,我已经将它与调试器(DebuggingWebConnection)一起使用了。但是我只希望该函数将连接作为列表返回。调试器也会下载所有内容。
public static void crawlPage() throws Exception {
final WebClient wc = new WebClient();
String resultFolder = "results";
final WebConnection connection = new DebuggingWebConnection(wc.getWebConnection(), resultFolder);
wc.setWebConnection(connection);
HtmlPage page = (HtmlPage) wc.getPage("http://www.test.com");
}
在results/index.html中返回;
GET http://www.test.com/ 200 (text/html) 14.53 Kib, 866ms
GET http://www.google-analytics.com/ga.js 200 (text/javascript) 77.38 Kib, 399ms
GET http://www.google-analytics.com/__utm.gif?utmwv=5.4.5&utms=1&utmn=1203166335&utmhn=www.test.com&utmcs=utf-8&utmsr=1024x768&utmvp=1256x605&utmsc=24-bit&utmul=en-us&utmje=0&utmfl=-&utmdt=Create%20Tests%20for%20Organizational%20Training%20and%20Certification%20Programs%20%E2%80%93%20Test.com&utmhid=121499150&utmr=-&utmp=%2F&utmht=1379757739907&utmac=UA-3518049-1&utmcc=__utma%3D99889051.1275286197.1379757740.1379757740.1379757740.1%3B%2B__utmz%3D99889051.1379757740.1.1.utmcsr%3D(direct)%7Cutmccn%3D(direct)%7Cutmcmd%3D(none)%3B&utmu=q~ 200 (image/gif) 0.03 Kib, 23ms
GET http://www.test.com/content/js/jquery.min.js 200 (application/x-javascript) 166.71 Kib, 981ms
GET http://www.test.com/content/style.css 200 (text/css) 15.44 Kib, 323ms
GET http://www.test.com/content/flexslider.css 200 (text/css) 2.68 Kib, 395ms
GET http://www.test.com/content/jquery.fancybox-1.3.4.css 200 (text/css) 8.76 Kib, 313ms
GET http://www.test.com/content/jwplayer/jwplayer.js 200 (application/x-javascript) 326.94 Kib, 724ms
GET http://www.test.com/content/js/jquery.flexslider-min.js 200 (application/x-javascript) 21.44 Kib, 320ms
GET http://www.test.com/content/js/jquery.fancybox-1.3.4.js 200 (application/x-javascript) 33.31 Kib, 364ms
GET http://www.test.com/content/js/functions.js 200 (application/x-javascript) 1.87 Kib, 223ms
GET http://www.test.com/assets/_video_thumbnail/47-9a8803a2.png 200 (image/png) 223.8 Kib, 692ms
GET http://l.longtailvideo.com/download/5/9/logo.png 200 (image/png) 1.8 Kib, 26ms
GET http://www.test.com/assets/_video_thumbnail/92-7b078568.png 200 (image/png) 213.78 Kib, 1421ms
GET http://www.test.com/assets/_video_thumbnail/90-d8d9524d.png 200 (image/png) 229.09 Kib, 595ms
GET http://www.test.com/assets/_video_thumbnail/93-52d92cf8.png 200 (image/png) 221.17 Kib, 587ms
有人知道如何在不使用调试器的情况下获取此列表吗?
最佳答案
我认为您不会找到一种简单的方法来做到这一点。主要是因为 HtmlUnit 是一个 headless 浏览器,而不是一个对连接进行操作的低级库(如 HtmlUnit 使用的 Apache HttpClient 类)。
也许,您应该重新考虑 HtmlUnit 的使用。如果您仍然想使用 HtmlUnit,那么我想您必须查看 DebuggingWebConection 的代码才能将其用作指导并创建您自己的 WebConnection 实现,这可能会继承自WebConnectionWrapper
。然后您必须自己处理连接列表的创建和维护。
关于java - HTMLUnit - 如何获取传出连接列表作为列表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18931350/
我想创建一个 Mercurial Hook ,当我推送到本地存储库时,它会推送到备份远程存储库。我以为我可以钩住“传出”钩子(Hook),但这会创建一个不漂亮的无限循环。那么是否有类似推送后的 Hoo
我有一个托管在 Tomcat 上的应用程序,它需要通过 IBM DataPower 设备对托管的服务进行 HTTPS 调用。我在日志中看到以下内容: http-bio-8080-exec-1, REA
是否有一个 hg 命令可以组合 hg传入 + hg传出 + hg status? 这会告诉您是否有任何远程内容需要传入,是否有任何本地提交的内容需要出去,或者是否有任何本地更改需要提交。 最佳答案 虽
我在 Azure 中有一个 Windows VM,用于 VS2015 实验。 Google 云端硬盘无法联系更新服务器来完成其自身的安装(尽管 Chrome/Omaha 工作正常)。 显然,我也无法通
我正在使用 QuickFIX/J (1.6.4)。我可以看到所有消息都非常正确地隔离(传入/传出/事件) , event> (Session FIX.4.2:CLIENT2/SUB-> sched
我在 Azure 中有一个 Windows VM,用于 VS2015 实验。 Google 云端硬盘无法联系更新服务器来完成其自身的安装(尽管 Chrome/Omaha 工作正常)。 显然,我也无法通
我正在使用 QuickFIX/J (1.6.4)。我可以看到所有消息都非常正确地隔离(传入/传出/事件) , event> (Session FIX.4.2:CLIENT2/SUB-> sched
我正在使用 docker-compose 运行我的应用程序。该应用程序包含许多容器。一个容器有一个 node.js 应用程序,另一个容器有一个 .net 核心应用程序。当尝试从任何容器向外部服务器发送
我想将文件从 HDFS 传输到不在 hadoop 集群中但在网络中的不同服务器的本地文件系统。 我本可以做到: hadoop fs -copyToLocal and then scp/ftp .
我遇到了一个奇怪的偶然事件,我的结果 lsof | grep 40006 制作 java 29722 appsrv 54u IPv6 71135755
我错误地 checkin 了一些更改。现在更改正在传出更改中,但我不希望它们交付。我怎样才能让它们回到 Unresolved 状态?如果我丢弃它们,它们就会从我的源代码中消失,我就会失去我的工作。 最
我在将 URL 参数添加到每个生成的 URL 或重定向到 ASP MVC 4 应用程序时遇到问题。 我想生成一个 ID,并在整个应用程序的任何时候使用这个 ID。在 session 中存储 id 不是
我正在开发一个 Java/Spring Web 应用程序,它对每个传入请求执行以下操作: 向第三方网络服务器发出大量请求, 检索每个人的响应, 将每个响应解析为 JSON 对象列表, 将 JSON 对
我有一个基本的“包装器”WinForms 应用程序,它有一些基本控件和一个 WebBrowser 控件 (System.Windows.Forms.WebBrowser)。这链接到一个网络服务,它完成
这个问题在这里已经有了答案: Can I send webrequest from specified ip address with .NET Framework? (3 个答案) 关闭 8 年前
我在这项研究中对交通路口进行研究,我试图找到有影响力的节点,也就是说......哪些路口会相互影响,我试图将我的网络表示为图形网络,所以我搜索了已经使用的算法在希望将同样的方法应用于我的问题的网络中,
我正在开发 OpenCL 1.2 处理大型图像的应用程序。 目前,我正在测试的图像是 16507x21244 像素。我的 内核在一个循环中运行,该循环对图像的 block 进行操作.内核将 32bpp
我知道有关断开链接的问题一直被问到,但我的问题似乎有点不同,而且没有一个解决方案有效。 现在,点击我的导航部分中的其他网站链接时,它们都不起作用。它记录它们在那里,如果您右键单击它并选择“在新选项卡中
我正在使用 node.js 构建数据传输代理服务器。它使用 http(s) REST API 将客户端请求通过管道传输到快速对象存储服务器。 It works fine for the individ
我有一个 Azure Servicebus 函数触发器,每当事件放入其指定队列时,该触发器就会调用外部端点。但是,当函数拾取事件并准备发出传出请求时,它会失败并显示以下日志消息 Executed 'A
我是一名优秀的程序员,十分优秀!