gpt4 book ai didi

python - 使用 WebKit(或 Gecko)查找呈现的 HTML 元素位置

转载 作者:太空宇宙 更新时间:2023-11-04 14:25:04 25 4
gpt4 key购买 nike

我想获取浏览器呈现的网页所有 HTML 元素的尺寸(坐标),即它们呈现的位置。例如,(左上角,右上角,左下角,右下角)

在 lxml 中找不到它。那么,Python 中是否有任何库可以执行此操作?我也看过 Perl 中的 Mechanize::Mozilla,但是,这似乎很难配置/设置。

我认为满足我的要求的最佳方法是使用渲染引擎 - 如 WebKit 或 Gecko。

是否有适用于上述两个渲染引擎的 perl/python 绑定(bind)? Google 搜索有关如何“插件”到 WebKit 渲染引擎的教程并不是很有帮助。

最佳答案

lxml 根本帮不了你。它根本不关心前端渲染。

要准确计算出某物的渲染方式,您需要对其进行渲染。为此,您需要挂接到浏览器、生成页面并在页面上运行一些 JS 以查找 DOM 元素并获取其属性。

这完全有可能,但我认为您应该首先了解网站屏幕截图工厂的工作原理(因为它们将共享启动浏览器并显示正确页面所需的 90% 的代码)。

您可能仍想使用 lxml 将 javascript 注入(inject)页面。

关于python - 使用 WebKit(或 Gecko)查找呈现的 HTML 元素位置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/980058/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com