gpt4 book ai didi

python - 如何使用 python 以编程方式测量 HTML 源代码中元素的大小?

转载 作者:太空狗 更新时间:2023-10-29 14:22:51 25 4
gpt4 key购买 nike

我正在用 python 进行网页布局分析。一个基本的任务是在给定 HTML 源代码的情况下以编程方式测量元素的大小,以便我们可以获得网页语料库的内容/广告比率、广告 block 位置、广告 block 大小的统计数据。

一个明显的方法是使用宽度/高度属性,但它们并不总是可用。此外,width: 50% 等内容需要在加载到 DOM 后进行计算。所以我想将 HTML 源代码加载到窗口大小预定义的浏览器中(比如 mechanize 虽然我不确定是否可以设置窗口的大小)是一个很好的尝试方法,但 mechanize 不支持返回无论如何都是一个元素大小。

在 python 中是否有任何通用的方法(没有宽度/高度属性),最好是使用一些库?

谢谢!

最佳答案

我建议你看看Ghost - 用 python 编写的 webkit 网络客户端。它支持 JavaScript,因此您可以轻松调用 JavaScript 函数并获取其返回值。示例显示了如何找出谷歌文本框的宽度:

>>> from ghost import Ghost
>>> ghost = Ghost()
>>> ghost.open('https://google.lt')
>>> width, resources = ghost.evaluate("document.getElementById('gbqfq').offsetWidth;")
>>> width
541.0 # google text box width 541px

关于python - 如何使用 python 以编程方式测量 HTML 源代码中元素的大小?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15664000/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com