gpt4 book ai didi

javascript - 在python中使用JavaScript函数抓取页面的问题

转载 作者:行者123 更新时间:2023-12-04 16:22:26 26 4
gpt4 key购买 nike

我被一个 python 问题困住了,看。

我必须废弃一个有 JS 函数的页面,但这不是真正的问题,真正的问题是我需要的信息是由函数提供的..所以我需要运行该函数以确保它会构建 HTML我需要的代码,然后对其进行处理以获得我想要的东西..

只是为了确保我清楚,JS 函数构建了 HTML 代码,但是当我废弃它时,它没有得到 HTML buid,它只是返回 JS 函数......

我正在使用 mechanize 和 beautifulSoup 进行抓取过程..有谁知道我必须做什么才能模拟 JS 函数来获取我需要的 HTML 代码?

提前致谢。

最佳答案

您需要一个支持 javascript 的报废框架。 Selenium是其中之一,我与 BeautifulSoup 一起使用取得了很好的效果。

您可能需要查看 PyVirtualDisplay如果您打算使用 Selenium with Mozilla Firefox .

关于javascript - 在python中使用JavaScript函数抓取页面的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13831716/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com