gpt4 book ai didi

c# - 爬虫/机器人如何工作?区分机器人/爬虫 http 请求

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:49:58 31 4
gpt4 key购买 nike

我在一个网站上工作。

我需要了解我的网站是否获得了来自 Google 或任何其他搜索引擎的抓取工具/机器人

的访问

在我的应用程序中,我正在拦截 http 请求。并且需要查明爬虫/机器人是否正在发出 http 请求来抓取我的网站。

我该怎么做?

最佳答案

检查用户代理字符串以查看它是否是已知机器人。一个例子:

protected void Page_Load(object sender, EventArgs e)
{
if (Request.UserAgent.Contains("Googlebot"))
{
//it's one of the google robots
}
else if (...)
{
...
}
}

对于谷歌,他们使用的代理列表可以在这里找到here .

其他的,你得自己去发现。

关于c# - 爬虫/机器人如何工作?区分机器人/爬虫 http 请求,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32166056/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com