gpt4 book ai didi

javascript - 执行关联的 JavaScript 后如何获取页面的源 HTML?

转载 作者:行者123 更新时间:2023-12-03 08:59:04 25 4
gpt4 key购买 nike

关于这个问题已经有一些安静的帖子,但似乎没有一个真正回答我的问题。

我使用TIdHttp加载该网站的源代码: http://www.nationalgeographic.com/

我尝试提取一些数据,但意识到这些数据是由脚本生成的。源代码中有一个脚本和一些外部 js 文件的链接。

我如何才能运行页面上的部分或全部脚本并生成源代码?

我在辅助线程中使用此部件,并希望避免使用 WebBrowser 组件。

我可以从 Idhttp 生成的源代码中提取脚本或链接,但使用 idhttp.get(*.js) 运行 js 文件,但我认为这可能太简单而无法工作。

最佳答案

最后,答案非常基本:

文档 := webBrowser.Document as IHTMLDocument2;
结果:= document.body.innerHTML;

它检索源代码并包含脚本在运行时动态生成的内容。

关于javascript - 执行关联的 JavaScript 后如何获取页面的源 HTML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32372055/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com