javascript - 为什么 Googlebot 从纯 JSON 网址请求 HTML？-6ren

javascript - 为什么 Googlebot 从纯 JSON 网址请求 HTML？

转载作者：行者123 更新时间：2023-11-29 14:49:35

26

4

在这样的页面上:https://medstro.com/groups/nejm-group-open-forum/discussions/61

我有这样的代码:

$.getJSON("/newsfeeds/61?order=activity&amp;type=discussion", function(response) {
  $(".discussion-post-stream").replaceWith($(response.newsfeed_html));
  $(".stream-posts").before($("<div class=\'newsfeed-sorting-panel generic-12\' data-id=\'61\'>\n<div class=\'newsfeed-type-menu generic-12\'>\n<ul class=\'newsfeed-sorting-buttons\'>\n<li>\n<span>\nShow\n<\/span>\n<\/li>\n<li>\n<select id=\"type\" name=\"type\"><option selected=\"selected\" value=\"discussion\">Show All (15)<\/option>\n<option value=\"discussion_answered\">Answered Questions (15)<\/option>\n<option value=\"discussion_unanswered\">Unanswered Questions (0)<\/option><\/select>\n<\/li>\n<\/ul>\n<\/div>\n<\/div>\n"));
  Newsfeed.prepare_for_newsfeed_sort($(".newsfeed-sorting-panel"));
});

Googlebot 已决定要查看 /newsfeeds/61?order=activity&type=discussion 是否有任何有趣的 HTML。因此，它会尝试抓取请求 HTML 的 URL，而我的应用会报告错误。 “ActionView::MissingTemplate:缺少模板新闻源/显示...”

为什么 Googlebot 会尝试抓取此网址？仅仅因为它认为那里有可能有一些有趣的东西并且它试图抓取所有东西？还是因为我的代码有问题？
在 Rails 中处理这个问题的最佳方法是什么？我不想忽略所有 MissingTemplate 错误，因为可能会有一些情况表明确实存在错误。忽略机器人创建的错误也是如此。我还有其他选择吗？

最佳答案

大概它从页面源解析了该 URL，并且只是试图抓取您的网站。

最好使用网站的 sitemap.xml 文件和 robots.txt 文件告诉 Google 抓取/不抓取哪些内容。

您可以告诉 Googlebot 不要使用 robots.txt 中的这些(或任何)GET 参数抓取页面:

Disallow: /*?

关于javascript - 为什么 Googlebot 从纯 JSON 网址请求 HTML？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27750397/

26

4

0

文章推荐： javascript - 登录后的 Angular JWT 和用户信息存储

文章推荐： android - 不幸的是，我的应用程序停止了，我该怎么办？

文章推荐： android - 如何在 Android 中检测 iBeacon？

文章推荐： javascript - linq.js Group By 那么Group By，怎么实现呢？

googlebot - Googlebot 从哪里抓取？
我一直在上下寻找 Googlebot 及其 sibling 从“CA”以外的位置抓取的位置，但没有找到特定于抓取的位置。我找到了 2008 年的数据中心 map (http://bit.ly/mONh
mobile - Googlebot 桌面被检测为移动设备
我正在迁移桌面网站以通过一组单独的 URL 支持移动设备。在网站的根目录，我使用媒体查询来检测用户是移动设备还是桌面设备，然后重定向到适当的区域。出于某种原因，桌面版 Googlebot(使用 Go
angular - Googlebot 可以读取此页面上的哪些元素？
关闭。这个问题需要更多focused .它目前不接受答案。想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post . 去年关闭。 Improve this questio
seo - Googlebot 无法加载页面资源
当我在 Google URL 检查工具上检查我的网站 URL 时，它显示无法加载页面资源，即图像、样式表和脚本文件。但是，我的网站在实时服务器上运行良好，而 Googlebot 智能手机无法正确呈现该
adsense - Googlebot 未读取动态内容
网站是完全动态的。元标签、opengraph 标签和内容是在网页上动态创建的。我可能做错了什么。请指导我获得 GOOGLE ADSENSE 计划的批准。为此，Google Adsense 给出了
dns - Googlebot 从哪里开始抓取？
已关闭。这个问题是 off-topic 。目前不接受答案。想要改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。已关闭13 年前。 Improve th
php - 验证 Googlebot
我将阻止除大型搜索引擎之外的所有机器人。我的阻止方法之一是检查“语言”:接受语言:如果没有接受语言，机器人的 IP 地址将被阻止到 2037 年。Googlebot 没有接受语言，我想用 DNS 验证
seo - GoogleBot 非常频繁地抓取导致服务器过载
我的网站有大约 500.000 页。我制作了 sitemap.xml 并在其中列出了所有页面(我知道每个文件限制 50.000 个链接，所以我有 10 个站点地图)。无论如何，我在 webmaster
seo - GoogleBot 超时前多久？
背景我目前正在使用 Google 的#! 方法通过代理和 PhantomJS 的组合为一个动态网站设置 SEO 索引。我们的 Web 应用程序不仅托管我们自己的应用程序，还托管由第三方提供的任意数量
ajax - googlebot 的动态内容
我有一个网站，该网站取决于用户从其他网络成员接收消息的位置。因此，通过工作流，用户需要将地址键入文本字段，并通过 ajax 回调返回答案。所有通过 POST 发送到服务器的请求。我的问题是如何让它对
iframe - Googlebot + IFrame？
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 11 年前。 Improve thi
search - googlebot 为什么以及如何使用我网站的搜索引擎？
不时查看我的搜索日志，我注意到到目前为止我的搜索引擎的最大用户是 google-bot。是什么赋予了？它是否正在寻找可能无法通过导航直接访问的内容？如果是这样，它如何知道要查找哪些单词和短语(它们非常
googlebot - 是否可以让 fail2ban 忽略谷歌？
由于我的服务器上有很多攻击尝试，我需要使用 fail2ban，我还有必须激活/创建的过滤器来阻止攻击尝试。但现在我很确定某些 google ip 最终进入了我的 fail2ban jail ....
seo - 仅允许 Googlebot 将所有内容编入索引
我想禁止所有机器人抓取网站并将其编入索引。除了 Googlebot。我想允许谷歌索引索引 (/) URL，但没有别的。最好在 robots.txt 中。您对如何实现这一目标有任何想法吗？谢谢! 最佳
robots.txt - googlebot 会索引我的网站吗？
在我的 robots.txt 文件中，我有以下行用户代理:Googlebot-Mobile不允许:/ 用户代理:GoogleBot不允许:/ 站点地图:http://mydomain.com/sit
reactjs - NextJS Googlebot 发生意外错误
我们使用 NextJS 开发了一个网站 SSR。在不同的桌面和移动浏览器中一切正常，但是当我尝试使用 Google Search Console 的“获取和渲染”功能以 google 的方式查看我的网
ruby-on-rails - Googlebot 收到现有模板的缺失模板错误
在过去的几天里，当 google bot 尝试访问我们的主页(欢迎/索引)时，我们开始收到缺少模板的错误。我已经盯着这个看了几个小时，知道我只是错过了一些简单的东西。 A ActionView::Mi
javascript - Googlebot 和 JavaScript
我的问题是googlebot是否可以跟踪通过javascript onchange函数重定向的页面: 示例: page1 page2 document.getElem
ASP.Net 身份验证和 Googlebot
我有一个启用了表单例份验证的 ASP.Net 3.5 网站。是否可以让 Googlebot 抓取我的网站而不提示输入用户名/密码？最佳答案 Google 声称不会索引页面并将其显示给不可用的用户，因
php - 向 Googlebot 隐藏内容
如果我想在 Mozilla Firefox 上隐藏一些内容，我使用这个代码: Hide only in Mozilla 我的问题是，如何向 Googlebot 隐藏一些内容？最佳答案您可以基于

首页

博学

6Ren·AI

商城

javascript - 为什么 Googlebot 从纯 JSON 网址请求 HTML？