gpt4 book ai didi

php - 使用 DOMDocument 从网站上抓取所有图像

转载 作者:行者123 更新时间:2023-12-03 22:54:16 28 4
gpt4 key购买 nike

我基本上想得到所有 使用 DOMDocument 的任何网站中的图像。
但是由于某些我还不知道的原因,我什至无法加载我的 html。

$url="http://<any_url_here>/";
$dom = new DOMDocument();
@$dom->loadHTML($url); //i have also tried removing @
$dom->preserveWhiteSpace = false;
$dom->saveHTML();
$images = $dom->getElementsByTagName('img');
foreach ($images as $image)
{
echo $image->getAttribute('src');
}

发生的事情是什么都没有打印。还是我的代码有问题?

最佳答案

You don't get a result because $dom->loadHTML() expects html. You give it an url, you first need to get the html of the page you want to parse. You can use file_get_contents() for that.



我在我的图像抓取类(class)中使用了它。对我来说很好用。
$html = file_get_contents('http://www.google.com/');
$dom = new domDocument;
$dom->loadHTML($html);
$dom->preserveWhiteSpace = false;
$images = $dom->getElementsByTagName('img');
foreach ($images as $image) {
echo $image->getAttribute('src');
}

关于php - 使用 DOMDocument 从网站上抓取所有图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15895773/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com