gpt4 book ai didi

php - PHP 网页抓取

转载 作者:技术小花猫 更新时间:2023-10-29 12:13:28 26 4
gpt4 key购买 nike

我正在寻找一种方法来根据用户在 PHP 中给出的 URL 对另一个页面进行小的预览。 .

我只想检索页面的标题、图像(如网站 Logo )和一些文本或描述(如果可用)。没有任何外部库/类,有没有简单的方法可以做到这一点?谢谢

到目前为止,我已经尝试使用 DOCDocument 类,加载 HTML 并将其显示在屏幕上,但我认为这不是正确的方法

最佳答案

我建议您考虑 simple_html_dom为了这。这将使它变得非常容易。

这是一个如何提取标题和第一张图片的工作示例。

<?php
require 'simple_html_dom.php';

$html = file_get_html('http://www.google.com/');
$title = $html->find('title', 0);
$image = $html->find('img', 0);

echo $title->plaintext."<br>\n";
echo $image->src;
?>

这是第二个示例,无需外部库即可执行相同的操作。我应该指出,在 HTML 上使用正则表达式并不是一个好主意。

<?php
$data = file_get_contents('http://www.google.com/');

preg_match('/<title>([^<]+)<\/title>/i', $data, $matches);
$title = $matches[1];

preg_match('/<img[^>]*src=[\'"]([^\'"]+)[\'"][^>]*>/i', $data, $matches);
$img = $matches[1];

echo $title."<br>\n";
echo $img;
?>

关于php - PHP 网页抓取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9813273/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com