gpt4 book ai didi

http-headers - HEAD 请求收到 "403 forbidden"而 GET "200 ok"?

转载 作者:行者123 更新时间:2023-12-04 12:43:33 30 4
gpt4 key购买 nike

几个月后,该网站从各大搜索引擎的搜索结果中消失了,我终于找到了可能的原因。

我使用 WebBug 来调查服务器 header 。查看请求是 HEAD 还是 GET 的区别。

HEAD 发送数据:

HEAD / HTTP/1.1
Host: www.attu.it
Connection: close
Accept: */*
User-Agent: WebBug/5.0

HEAD 接收到的数据:
HTTP/1.1 403 Forbidden
Date: Tue, 10 Aug 2010 23:01:00 GMT
Server: Apache/2.2
Connection: close
Content-Type: text/html; charset=iso-8859-1

GET 发送数据:
GET / HTTP/1.1
Host: www.attu.it
Connection: close
Accept: */*
User-Agent: WebBug/5.0

GET 接收到的数据:
HTTP/1.1 200 OK
Date: Tue, 10 Aug 2010 23:06:15 GMT
Server: Apache/2.2
Last-Modified: Fri, 08 Jan 2010 08:58:01 GMT
ETag: "671f91b-2d2-47ca362815840"
Accept-Ranges: bytes
Content-Length: 722
Connection: close
Content-Type: text/html

// HTML code here

现在,浏览器默认发送 GET 请求(至少 firebug 是这么说的)。爬虫是否有可能改为发送 HEAD 请求?如果是这样,为什么只有这台服务器以 403 响应,而我正在维护的其他站点的其他服务器却没有?

如果这很重要,.htaccess 中唯一的一行是(除非我的客户改变了它,因为他们不想让我访问他们的服务器)
AddType text/x-component .htc

更新
谢谢@Ryk。 FireBug 和 Fiddler 都发送 GET 请求,获得 200(或 300)个响应。正如预期的那样。所以我想这要么是服务器设置不当(尽管这很奇怪,因为托管来自拥有数百万客户的大公司)或他们放入 .htaccess 中的内容。他们将不得不让我查看他们的帐户。

我的问题的第二部分是这是否可能是该网站未出现在任何搜索引擎中的原因(网站:www.attu.it 没有提供任何结果)。任何想法?

更新 2
经过一番摆弄,结果发现根目录中有 phpMyAdmin 机器人阻塞 .htaccess,导致机器人的任何请求都被发送回 403 Forbidden

最佳答案

我建议安装 Fiddler 并仔细查看请求。我有时看到页面上需要身份验证的文件夹中的图标会导致返回 403。

Fiddler 会给你一个好主意,你也可以尝试 Firefox 并安装 FireBug 插件并检查页面是否有错误。

查看该站点,我为 favicon.ico 获得了一堆 404,但除此之外,当我执行简单的 GET 请求时,我获得了 200 OK,但是当我执行 HEAD 时,我也获得了 403。现在查看它.

更新:我认为这可能是 Apache 服务器上的配置,但不是 100% 确定。 http://hc.apache.org/httpclient-3.x/methods/head.html

更新 2:阅读本文 http://www.pubbs.net/200811/httpd/17210-usershttpd-how-to-reject-head-request.html让我相信您的 Apache 服务器可以设置为拒绝 HEAD 请求。在这种情况下,它将返回 403。

关于http-headers - HEAD 请求收到 "403 forbidden"而 GET "200 ok"?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3454286/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com