gpt4 book ai didi

java - HtmlUnit webscraping 带有带有 JavaScript 的下 zipper 接的 anchor 标记

转载 作者:行者123 更新时间:2023-11-28 03:36:04 28 4
gpt4 key购买 nike

当您将鼠标悬停在初始链接上时,当该链接具有链接下拉列表时,是否可以使用 HtmlUnit 单击该链接。如果您单击初始链接,除了您获得鼠标悬停时下拉的链接列表外,什么也不会发生。我想单击其中一个下 zipper 接并获取与该链接关联的网页。

问题似乎是 Anchor 有 JavaScript,而且它是一个下拉列表。如果 anchor 没有 JavaScript 并下拉,那么我就不会有任何问题。

这是相关的 JavaScript 代码:

<script language='JavaScript' type='text/javascript'>
<!--
function mmLoadMenus(){
window.mm_menu_0805151542_0 = new Menu("root",211,23,"Arial, Helvetica, sans-serif",11,"#FFFFFF","#FFFFFF","#056CB9","#014D98","left","middle",3,0,1000,-5,7,true,false,true,2,true,false);
mm_menu_0805151542_0.addMenuItem("View&nbsp;Tax&nbsp;Sales","window.open('TCTaxSaleBrief.asp', '_blank','width=800,height=580,scrollbars=1,resizable=yes,top=50,left=100');");
mm_menu_0805151542_0.addMenuItem("Registration&nbsp;Renewal&nbsp;Reprint","window.open('vrRenewal.asp', '_blank','width=800,height=580,scrollbars=1,resizable=yes,top=50,left=100');");
mm_menu_0805151542_0.addMenuItem("Drivers&nbsp;License","window.open('http://www.dds.ga.gov/', '_blank');");
mm_menu_0805151542_0.addMenuItem("Online&nbsp;Tag&nbsp;Renewals","location='../TaxCommissioner/TagRenewal.html'");
mm_menu_0805151542_0.hideOnMouseOut=true;
mm_menu_0805151542_0.bgColor='#CCCCCC';
mm_menu_0805151542_0.menuBorder=0;
mm_menu_0805151542_0.menuLiteBgColor='#FFFFFF';
mm_menu_0805151542_0.menuBorderBgColor='#015BA7';

</script>

这是相关的 anchor :

<a href="#" name="link11" class="nav" id="link10" onmouseover="MM_showMenu(window.mm_menu_0805151542_0,104,0,null,'link11')" onmouseout="MM_startTimeout();">Online Services</a><br />

这是我用来完成这项工作的 Java 代码片段。

WebClient webClient = new WebClient(BrowserVersion.FIREFOX_10);
String webPage="http://website.html";
try {
HtmlPage taxComPage = webClient.getPage(webPage);
HtmlElement htmlElement = taxComPage.getDocumentElement();
//HtmlAnchor anchor = taxComPage.getAnchorByText("View Tax Sales");
//HtmlAnchor htmlAnchor = taxComPage.getHtmlElementById("link10");
HtmlAnchor anchor = taxComPage.getAnchorByText("Online Services");

HtmlPage page = anchor.click();
}catch

如果 HtmlUnit 不适用于 JavaScript,请告诉我!

谢谢

我知道有一个叫做 mmLoadMenus() 的函数,当鼠标悬停在上面时会显示文本,但我对这个函数如何与 anchor 相关联有疑问。在 anchor 中有一个叫做 MM_showMenu 的东西。这个 MM_showMenu 是什么,谁创建的,这是一个 JavaScript 关键字,我没有看到它在任何地方被定义。我搜索了整个页面,唯一提到它的地方是 anchor 。它似乎是某种类型的函数,其参数为: window.mm_menu_0805151542_0,104,0,null,'link11' 被传递给它。我可以在函数 mmLoadMenus() 和 anchor 之间建立的唯一联系是 anchor 中有 mm_menu_0805151542_0。我不太精通 JavaScript,也许这就是为什么我没有与 JavaScript 函数和 anchor 建立紧密联系的原因。

最佳答案

数据已经在页面上了,为什么不从 JavaScript 函数本身抓取它呢。只需解析文本 - 比尝试强制加载要容易得多。

关于java - HtmlUnit webscraping 带有带有 JavaScript 的下 zipper 接的 anchor 标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14201665/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com