gpt4 book ai didi

php - 在浏览器中找到该页面时,cURL 返回 404

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:35:46 26 4
gpt4 key购买 nike

在 stackoverflow 上已经有类似的问题,但他们的解决方案都没有对我有用。我正在尝试使用 cURL 在 LoveIt.com 上抓取一个页面,但它返回 404 错误,而该 url 在浏览器中工作正常:

        $url = 'http://loveit.com/loves/P0D1jlFaIOzzZfZqj_bY3KV';

$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)");
curl_setopt ($curl, CURLOPT_HEADER, false);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($curl, CURLOPT_REFERER,'http://loveit.com/');

这是我收到的 header :

Array ( [url] => http://loveit.com/loves/P0D1jlFaIOzzZfZqj_bY3KV [content_type] => text/html; charset=utf-8 [http_code] => 404 [header_size] => 667 [request_size] => 172 [filetime] => -1 [ssl_verify_result] => 0 [redirect_count] => 0 [total_time] => 0.320466 [namelookup_time] => 0.000326 [connect_time] => 0.119046 [pretransfer_time] => 0.119089 [size_upload] => 0 [size_download] => 499 [speed_download] => 1557 [speed_upload] => 0 [download_content_length] => 499 [upload_content_length] => 0 [starttransfer_time] => 0.320438 [redirect_time] => 0 [certinfo] => Array ( ) [primary_ip] => --- [primary_port] => 80 [local_ip] => --- [local_port] => 53837 [redirect_url] => )

我读到一些网站有针对此类脚本的保护措施;我确实测试了一些提出的解决方案,但没有一个对我有用(CURLOPT_USERAGENT,CURLOPT_REFERER ...)

对这里发生的事情有什么想法吗?

我想备份我的 LoveIt 帐户,这就是我做这个的原因(没有导出功能,也没有来自 LoveIt.com 的关于网站健康状况的回复)

最佳答案

我在启用 LiveHeaders 的情况下快速检查了上述页面,我注意到设置了一堆 cookie。我怀疑,因为它不是“正常”的 url,你需要在被重定向时传递这些 cookie,否则你最终会被 404 踢出。在开始时将 CURLOPT_COOKIEJAR 与你的 cURL 实例一起使用。请参阅:http://php.net/manual/pl/function.curl-setopt.php

关于php - 在浏览器中找到该页面时,cURL 返回 404,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17476828/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com