gpt4 book ai didi

php - 网页抓取 JAVASCRIPT 内容的语言

转载 作者:太空宇宙 更新时间:2023-11-03 16:57:14 25 4
gpt4 key购买 nike

我认为主题提出了问题,我通常使用 PHP 进行解析/网络抓取,但我在抓取 javascript 时真的很糟糕,大多数情况下我做不到

例如:解析执行 javascript 时出现的 div。

我读过有关 RUBY 的文章,它有一个 javascript 解析器库,所以问题是 w 是一个网络抓取程序的语言,它将有效地抓取 javascript 生成的内容?它是一个 PHP 库,就像用于解析 javascript 内容的 ruby​​ 库一样?

最佳答案

为此有一些策略。根据您的需要,考虑以编程方式实例化一个浏览器实例,您可以连接到该实例并从中读取页面。

想法是,让浏览器完成工作,因为页面是为浏览器而不是您的机器人制作的。然后,您可以使用浏览器插件轻敲并抓取数据,该插件将数据提供给您运行的主要应用程序。

尽管如此,这对于您需要的东西来说可能有点矫枉过正。我将由您决定。

关于php - 网页抓取 JAVASCRIPT 内容的语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6753871/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com