- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我正在阅读 this specification这是网络服务器和搜索引擎爬虫之间的协议(protocol),允许动态创建的内容对爬虫可见。那里指出,为了让爬虫索引 html5 应用程序,必须在 URL 中使用 #!
实现路由。在 Angular html5mode(true)
中,我们去掉了 URL 的散列部分。我想知道这是否会阻止抓取工具将我的网站编入索引。
最佳答案
简短回答 - 不,html5mode 不会弄乱您的索引,但请继续阅读。
重要说明:Google 和 Bing 都可以在没有 HTML 快照的情况下抓取基于 AJAX 的内容
我知道,您链接到的文档另有说明,但大约一两年前,他们正式宣布他们处理 AJAX 内容而不需要 HTML 快照,只要您使用 pushstates,但是很多文档都是旧的,不幸的是没有更新。
使用推送状态的 SEOAJAX 抓取开箱即用的要求是您正在使用 pushstates 更改您的 url。这正是 Angular 中的 html5mode 所做的(以及许多其他框架所做的)。当 pushstates 开启时,爬虫将等待 ajax 调用完成并等待 javascript 在索引页面之前更新页面。您甚至可以更新路由器中的页面标题甚至元标记等内容,它会正确索引。从本质上讲,您不需要做任何事情,在这种情况下,服务器端和客户端呈现的网站之间没有区别。
需要明确的是,许多 SEO 分析工具(例如 Moz)会在使用 pushstates 的页面上发出警告。那是因为这些工具(以及他们的代表,如果您与他们交谈)在撰写本文时还不是最新的,所以请忽略它们。
最后,确保您在执行此操作时不使用下面的片段元标记。如果你有那个标签,爬虫会认为你想使用非 pushstates 方法,事情可能会变得一团糟。
没有推送状态的 SEO没有什么理由不在 Angular 中使用 pushstates,但如果您不这样做,则需要遵循问题中链接的指南。简而言之,您在服务器上创建 html 的快照,然后使用片段元标记将您的 url 片段更改为“#!”而不是“#”。
<meta name="fragment" content="!" />
当爬虫找到这样的页面时,它会删除 url 的片段部分,而是使用参数 _escaped_fragment_ 请求 url,您可以提供您的快照页面作为响应。为爬虫提供一个正常的静态页面以进行索引。
请注意,只有在您想要触发此行为时才应使用片段元标记。如果您正在使用 pushstates 并希望页面以这种方式编制索引,请不要使用此标记。
此外,在 Angular 中使用快照时,您可以启用 html5 模式。在 html5mode 中,片段是隐藏的,但它在技术上仍然存在,并且仍然会触发相同的行为,假设片段元标记已设置。
警告 - Facebook 爬虫虽然 Google 和 Bing 都可以毫无问题地抓取您的 AJAX 页面(如果您使用的是 pushstates),但 Facebook 不会。 Facebook 不理解 ajax 内容并且仍然需要特殊的解决方案,例如专门为 facebook 机器人提供的 html 快照(用户代理 facebookexternalhit/1.1)。
编辑 - 我应该提一下,我已经部署了所有这些版本的网站。既有 html5 模式、片段元标记和快照,也没有任何快照,仅依赖 pushstate-crawling。一切正常,除了上面提到的 pushstates 和 Facebook。
关于javascript - html5mode(true) 是否影响谷歌搜索爬虫,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31437815/
大家好, 我看到了来自 java 项目中的 jsp 页面。 想问一下这些html标签有什么区别。 请多多指教。 示例代码如下: 最佳答案 使用struts-html标签库,其中只是普
我有一个页面,我正在从电子邮件中读取 HTML。 有时,来自电子邮件的文本包含 HTML 和 CSS,它完全改变了我的页面样式。 我不希望我的页面样式因此受到影响。我如何严格阅读特定 div(框)内的
我知道有类似的问题,但我想对我的特定代码进行一些输入。 我有一个图像,我将其切成 9 块,并创建了一个 3x3 HTML 表来显示它。 但是我的表在行之间有空格,但在列之间没有空格。我没有使用任何 C
编辑:Waylan 的回答成功了!谢谢! 我正在尝试压缩文档的 .html 文件以发送给客户。目标是获得与浏览实际网站相同的体验。 打开 .html 文件时,单击的任何链接都会转到父文件夹,而不是特定
编辑:Waylan 的回答成功了!谢谢! 我正在尝试压缩文档的 .html 文件以发送给客户。目标是获得与浏览实际网站相同的体验。 打开 .html 文件时,单击的任何链接都会转到父文件夹,而不是特定
这是 question 的扩展.我正在尝试解析嵌入在 Blogger 博客的 XML 备份中的 HTML 片段,并用 InDesign 标签重新标记它们。 Blogger 并未对其任何帖子的 HTML
我知道在 html 中元素之间的换行符被视为空格,但我认为当您尝试使用响应式布局时这非常可怕。 例如,这里我们有预期和正确的行为,但要获得它,我必须删除元素之间的 html 中的换行符: https:
我正在尝试将文本文件显示为 html。我正在使用 ionic 。我正在发送一个 html 格式的响应,但在一个文本文件中发送到配置文件页面。它在 .ts 页面的变量名中。 @Component({
假设我有一个 html 文档: test 我想在浏览器中显示该代码。然后我会创建类似的东西: <html>test<html> 为了在中间制作 gubbins,我有一个函数
HTML 元素和 HTML 标签有什么区别?渲染有什么区别吗?使用标签或元素时有什么特殊注意事项吗? 最佳答案 是一个标签,特别是一个开始标签 也是一个标签,一个结束标签 This is a para
我有这个表格的模态形式。该表正在填充大量数据,但我不想分页。相反,我想以模式形式降低表格的高度并为表格添加溢出。下面是我的代码,但它不起作用。 请问我该如何实现? CSS #table{
我记得有一个 Linux 命令可以从给定的 URL 返回 HTML 代码。您可以将 URL 作为此命令的参数,然后返回 HTML 代码,而不是在浏览器中输入 URL。 哪个命令执行此操作? 最佳答案
我有一个 html 页面,我想在其中包含另一个有很多链接的 html 页面。我能够使用 iframe 实现它,但我希望 iframe 内的页面具有与原始页面相同的文本和链接颜色属性,我不想要滚动条,我
我正在使用 HTML 写一本书。如果我把它写在一个 html 文件中,整个代码就会变长,所以我想将每一章保存到不同的文件中,然后将它们加载到主 html 中。我的意思是有像 chapter1.html
在显示之前,我必须将一个网站重定向到另一个网站。我试过使用 .htaccess,但它给我带来了问题。我也使用过 javavscript 和 meta,但在加载我要从中传输的页面之前它不起作用。帮助?
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
如何打印“html”标签,包括“”?如何在不使用文本区域和 Javascript 的情况下对任何标签执行此操作? 最佳答案 使用HTML character references : <html
我需要将 Ruby on Rails 应用程序中的 html.slim 文件转换为 html.erb。有什么简单的方法吗?我尝试了 Stack Overflow 和其他网站中列出的许多选项。但对我没有
这个问题在这里已经有了答案: Is it necessary to write HEAD, BODY and HTML tags? (6 个答案) 关闭 8 年前。 我在 gitHub 上找到了这个
如果不允许通过 JavaScript 进行额外的 DOM 操作,我正在寻找可以加载外部资源的元素列表。我正在尝试使用 HTML 查看器托管来自第三方的电子邮件,当发生这种情况时,我需要删除任何自动加载
我是一名优秀的程序员,十分优秀!