true, // return web page -6ren">
gpt4 book ai didi

c# - Curl - 获取包含图像和 css 的页面

转载 作者:行者123 更新时间:2023-12-02 19:13:54 25 4
gpt4 key购买 nike

<?php
function get_web_page($url)
{
//echo "curl:url<pre>".$url."</pre><BR>";
$options = array(
CURLOPT_RETURNTRANSFER => true, // return web page
CURLOPT_HEADER => false, // don't return headers
CURLOPT_FOLLOWLOCATION => true, // follow redirects
CURLOPT_ENCODING => "", // handle all encodings
CURLOPT_USERAGENT => "spider", // who am i
CURLOPT_AUTOREFERER => true, // set referer on redirect
CURLOPT_CONNECTTIMEOUT => 15, // timeout on connect
CURLOPT_TIMEOUT => 15, // timeout on response
CURLOPT_MAXREDIRS => 10, // stop after 10 redirects

);

$ch = curl_init($url);
curl_setopt_array( $ch, $options );
$content = curl_exec( $ch );
$err = curl_errno( $ch );
$errmsg = curl_error( $ch );
$header = curl_getinfo( $ch,CURLINFO_EFFECTIVE_URL );
curl_close( $ch );

$header['errno'] = $err;
$header['errmsg'] = $errmsg;

//change errmsg here to errno
if ($errmsg)
{
echo "CURL:".$errmsg."<BR>";
}
return $content;
}
print_r(get_web_page('http://google.com'));
?>

为什么在这个例子中我没有图像和 CSS?我怎么才能得到它?是简单的解决方案吗?我必须添加http://google.com在所有链接之前,但是如何?

最佳答案

您可能对这样的库感兴趣:http://phpcrawl.cuab.de/

libcurl 本身不能充当网络爬虫,因为它不分析页面内容。这是你必须自己完成的工作。

关于c# - Curl - 获取包含图像和 css 的页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13364187/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com