gpt4 book ai didi

javascript - 从网页中提取源代码中没有的数据

转载 作者:行者123 更新时间:2023-11-28 07:14:52 24 4
gpt4 key购买 nike

我想在 Excel 中编写一个宏,从下面的网页中提取数据:

http://www.richmond.com/data-center/salaries-virginia-state-employees-2013/?appSession=673718284851033&RecordID=101177&PageID=3&PrevPageID=2&cpipage=1&CPIsortType=&CPIorderBy=&cbCurrentRecordPosition=1

我遇到的问题是员工信息数据不在页面源中,因此当我使用下面的代码(其中 NextPage 设置为上述 URL)时,responseText 不会不包括我正在寻找的数据。

With CreateObject("msxml2.xmlhttp")
.Open "GET", NextPage, False
.Send
htm.body.innerHtml = .responseText
End With

我很可能是错的,但我相信数据包含在页面的 DOM 中。有人可以帮助我了解如何使用 VBScript 下载显示的此页面的内容(即应用 javascript 修改后)吗?

最佳答案

使用 InternetExplorer.Application COM 对象应该可以让您访问实际的 DOM 树:

url = "http://www.richmond.com/..."

Set ie = CreateObject("InternetExplorer.Application")
ie.Visible = True

ie.Navigate url

Do
WScript.Sleep 100
Until ie.ReadyState = 4

Set elem = ie.Document.getElementById("...")

如果这不起作用,您可能必须求助于 PhantomJS 之类的东西.

关于javascript - 从网页中提取源代码中没有的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30941831/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com