gpt4 book ai didi

Robots.txt 中的 Facebook 和抓取延迟?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:27:05 30 4
gpt4 key购买 nike

Facebook 的网络爬虫机器人是否尊重 Crawl-delay: robots.txt 文件中的指令?

最佳答案

不,它不尊重 robots.txt

与这里的其他答案相反,facebookexternalhit 的行为就像最卑鄙的爬虫。当它以疯狂的速度遍历每一个时,无论它从爬行还是从点赞按钮获得它请求的 url 都无关紧要。

有时我们每秒会获得数百次点击,因为它几乎遍历了我们网站上的每个网址。它每次都会杀死我们的服务器。有趣的是,当这种情况发生时,我们可以看到 Googlebot 放慢速度并等待事情稳定下来,然后再慢慢恢复。另一方面,facebookexternalhit 只会继续攻击我们的服务器,通常比杀死我们的最初回合更猛烈。

仅仅因为 facebookexternalhit,我们必须运行比我们实际需要的流量更强大的服务器。我们进行了大量搜索,但找不到减慢速度的方法。

Facebook 是怎样一种良好的用户体验?

关于Robots.txt 中的 Facebook 和抓取延迟?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7716531/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com