gpt4 book ai didi

php - 扫描整个网站的页面以获取一段代码

转载 作者:行者123 更新时间:2023-12-04 04:52:24 25 4
gpt4 key购买 nike

这个问题在这里已经有了答案:





How do I make a simple crawler in PHP? [closed]

(15 个回答)


8年前关闭。




我正在运行一项服务,其中涉及网站所有者必须将一段代码放到他们的网站上。它在哪个页面上并不重要。

我正在寻找一种使用 PHP 来检查给定网站 URL 的页面以获取一段代码的方法。有人能指出我正确的方向吗?

我知道如何扫描给定 URL 的页面,但我需要一种使用 PHP 收集所有页面 URL 并在这些页面中的每一个页面中搜索一行代码的方法。

谢谢! :)

最佳答案

这可以像 cURL 一样简单获取 HTML 和 strpos() 查看该特定字符串是否存在于 HTML 中。

然而,这确实存在问题!如果您要求人们提供链接或其他内容,稍后只需设置 display:none 即可轻松使用 CSS 隐藏该元素。 .为了解决这个问题,您需要更高级的东西来实际检查项目的存在和可见性。 PhantomJS可以用于此。

现在,当人们想要使用缩小器或以其他方式修改 HTML 的同时保持添加链接的精神时会发生什么?我建议不要寻找确切的 HTML,而是要检查您真正要寻找的内容……例如指向您网站的反向链接。在任何情况下,您都可以使用 DOM 解析器来帮助解决这个问题。

关于php - 扫描整个网站的页面以获取一段代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17253264/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com