- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我最近对一个电子商务网站进行了一些重大更改,其中包括 url 结构。查看产品的 url 由 .htaccess 修改并包含简短的产品描述,如果更改不会影响页面上的结果。
示例:www.Example.com/staticFolder/non-deterministic-product-details/MODEL#.html
现在在错误日志文件中我看到 bingbot 请求像 example.com/non-deterministic-product-details
我们的站点地图不链接到此页面,我无法在页面上找到任何错误链接。有没有其他人对 bingbot 这样做有问题?我发现了另一个因随机而被锁定的问题。 Bingbot causing 404 errors .我做错事的可能性更大吗?我应该避免在我的 .htaccess 中使用伪目录吗?
-谢谢
最佳答案
没有什么要求蜘蛛只坚持链接抓取。它完全有可能猜测与已知 URL 相似的 URL,希望它能找到一些东西。
无论如何,我不会担心它,除非您知道它跟随的是错误链接。收到大量针对不存在页面的请求是很正常的。
关于php - Bingbot 试图访问不存在的页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19909828/
我最近对一个电子商务网站进行了一些重大更改,其中包括 url 结构。查看产品的 url 由 .htaccess 修改并包含简短的产品描述,如果更改不会影响页面上的结果。 示例:www.Example.
当 bing 尝试索引一些具有 unicode 字符的页面时,我的网站出现了很多错误。 例如: http://www.example.com/kjøp Bing 正在尝试索引 http://www.e
在我的 CPU 使用率由于机器人淹没我的网站而突然超过 400% 之后,我创建了一个 robots.txt 并将该文件放在我的根目录中,例如“www.example.com/”: User-agent
我现在希望完全阻止 bing 抓取我的网站(它以惊人的速度攻击我的网站(每月 500GB 的数据)。 我已将 1000 个子域添加到 bing 网站管理员工具中,因此我无法设置每个子域的抓取速度。 我
我是一名优秀的程序员,十分优秀!