gpt4 book ai didi

ajax - Hashbang URL 使网站难以被 Google 抓取?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:29:48 24 4
gpt4 key购买 nike

我们的机构构建了一个使用大量 AJAX 交互和 #! (hashbang)网址:http://www.gunlawsbystate.com/

这是一本很长的书,您可以滚动浏览,地址栏中的 URL 会动态变化。我们必须支持 IE,所以请不要建议使用 pushState——hansbang 是我们目前唯一的选择。

左侧边栏中有一个导航,其中包含指向本书所有章节的链接。

链接示例: http://www.gunlawsbystate.com/#!/federal-properety/national-parks-and-wildlife-refuges/

我们期待谷歌抓取这个:http://www.gunlawsbystate.com/?_escaped_fragment_=/federal-properety/national-parks-and-wildlife-refuges/这是该部分的完整 html 快照。 (+ 有指向 www.gunlawsbystate.com/#!/federal-properety/national-parks-and-wildlife-refuges/ii-change-in-the-law/等小节的链接 => www.gunlawsbystate.com/?_escaped_fragment_=/federal-properety/national-parks-and-wildlife-refuges/ii-change-in-the-law/).

根据 Google 的规范 (developers.google.com/webmasters/ajax-crawling/docs/specification),这一切看起来都是完整的。该网站目前运行了大约 3 个月。主页每 10-15 天重新编入索引。

问题在于,出于某种原因,Google 无法正确抓取 hashbang 网址。看起来 Google 只是“不喜欢”这些 URL。

www.google.ru/search?&q=site%3Agunlawsbystate.com :只有 67 页被编入索引。请注意,Google 索引的大多数页面都有“正常”的 URL(主要是 wordpress 博客文章、类别和标签),只有 5-10% 的结果页面是 hashbang URL,尽管有超过 400 个具有独特内容的书籍部分,Google 应该如果它正确地抓取它,真的很喜欢。

谁能给我一个建议,为什么 Google 不能正确抓取我们的书页?任何帮助将不胜感激。

附言对于不可点击的链接,我很抱歉 - stackoverflow 不允许我发布超过 2 个。

UPD. 站点地图已提交给谷歌。 Google Webmaster Tools 表示提交了 518 个 URL,只有 62 个 URL 被编入索引。此外,在网站管理员工具的“索引状态”页面上,我看到有 1196 个页面 Ever crawled; 1071 页未选中。它清楚地指出了这样一个事实,即出于某种原因,谷歌没有为 #!它经常访问的页面。

最佳答案

你错过了一些东西。首先,您需要一个元标记来告诉谷歌哈希 URL 可以通过不同的 url 访问。

<meta name="fragment" content="!">

接下来,您需要将每个网址的映射版本提供给 googlebot。

当谷歌访问时:

http://www.gunlawsbystate.com/#!/federal-regulation/airports-and-aircraft/ii-boarding-aircraft/

它将改为爬行:

http://www.gunlawsbystate.com/?_escaped_fragment_=federal-regulation/airports-and-aircraft/i-introduction/

为此,您需要使用 PHP 或 ASP 之类的工具来提供正确的页面。如果管道正确,Asp.net 路由也可以工作。有些服务实际上会为您创建这些“快照”版本,然后您的元标记将指向它们的服务器。

关于ajax - Hashbang URL 使网站难以被 Google 抓取?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11622346/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com