gpt4 book ai didi

c++ - 在C++中使用curl获取一段时间后更改的页面

转载 作者:行者123 更新时间:2023-12-02 10:27:46 26 4
gpt4 key购买 nike

我试图用C++创建网络爬虫(我知道我可以使用其他语言,但我只是想学习)。我正在尝试将一个网页获取html代码,但是使用我想要的链接在一两秒钟后页面就会更改。如何使程序等到某个时间返回html?
编辑:我想一次进行一次curl调用,然后等待一段时间,然后过一段时间再对同一网页进行另一个curl调用。 (不要再次打开链接,因为它会显示相同的页面)

最佳答案

您有三种选择:

  • 对网站进行调查,找出javascript代码如何更改页面,然后以C++复制(通过硬编码URL或解析页面的一部分),
  • 嵌入了一个可理解JavaScript的完整浏览器引擎,并在更改后单击链接,或者
  • 放弃C++,使用专用的抓取工具,例如CasperJS或Scrapy或wring或...

  • 我将检查页面,看看是否可以使选项1正常工作,但到目前为止,选项3是最简单的方法。

    关于c++ - 在C++中使用curl获取一段时间后更改的页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63555914/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com