gpt4 book ai didi

php - 以编程方式分析 CSS 布局

转载 作者:太空狗 更新时间:2023-10-29 21:10:23 26 4
gpt4 key购买 nike

我想抓取一些博客并以编程方式分析它们基于 html 和 css 的布局以查看例如如果侧边栏位于主要内容的左侧或右侧,则列数和宽度。

我怎样才能最好地做到这一点?有没有我可以使用的工具或库?

(我更喜欢 Python 或 PHP 的解决方案。)

最佳答案

这听起来像是使用纯服务器端 CSS 和 HTML 解析来完成的一项极其艰巨的任务 - 您实际上必须重新创建浏览器的渲染引擎才能获得可靠的结果。

根据您的需要,我可以按照以下思路想出一种方法:

  • 使用 wget--page-requisites

  • 获取页面和样式表
  • 然后:

    • 使用类似 Selenium 的工具遍历每个下载的页面,搜索元素名称并输出它们的位置(如果这在 Selenium 中是可能的。我假设是,但我不确定)

    • 创建一个 jQuery 片段,将其注入(inject)到每个下载的页面中。 jQuery 搜索名为“sidebar”、“toolbar”等的元素,获取它们的位置,将结果保存到本地 AJAX 片段,并继续到下一个下载页面。您只需在浏览器中打开第一页,其余的将自动发生。实现起来并不容易,但有可能。

如果您可以使用像 .NET 这样的客户端应用程序平台,您可能更容易构建包含浏览器控件的自定义应用程序,与仅使用 jQuery 相比,您可以更自由地访问其 DOM。

关于php - 以编程方式分析 CSS 布局,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5015532/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com