- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我一直在和我的 friend 们一起从头开始建立一个论坛,只是为了好玩,我们开始看到机器人和爬虫过去了。我们遇到的问题是您可以加载包含四个回复的页面/post/1,并且每个回复都包含一个指向自身/reply/1#reply-1 的固定链接。如果我在/post/1 并导航到/reply/1,我将直接回到我开始的地方,只是回复的 anchor 。但!爬虫不知道是这种情况,所以他们打开每个/post 链接,然后跟踪每个/reply 链接,这会导致性能问题,所以我一直在搜索 SEO 网站以尝试修复它。
我已经开始在/reply 页面上使用 rel=canonical 来告诉机器人它们都是一样的,但据我所知这对我没有帮助直到机器人已经加载页面,因此我得到了大量的访问量。改变我的是否正确
<a href="/reply/1#reply-1">Permalink</a>
标记为
<a href="/reply/1#reply-1" rel="self">Permalink</a>
因为它们应该是相同的内容?还是这会误用 rel="self"而我应该使用另一个更好的 rel 标签?
最佳答案
self
链接类型 没有为 HTML 定义(但是 for Atom ),所以它是 can’t be used in HTML5文档。
canonical
链接类型 适合您的情况(如果您确保它始终指向正确的页面,以防线程被分页),但它不会阻止机器人抓取 URL。
如果您想阻止抓取,任何链接类型都无济于事(即使是 nofollow
链接类型,但无论如何都是 not appropriate for your case)。您必须使用 robots.txt,例如:
User-agent: *
Disallow: /reply/
也就是说,您可能要考虑更改永久链接设计。我认为拥有这样的架构是没有用的(无论是对你的用户还是机器人)。每个文档只有一个 URL 是一种很好的做法,如果用户想要链接到某个帖子,如果实际上是同一个文档,则没有理由要求加载新页面。
所以我会使用“规范”URL 并添加一个片段组件 (/post/1#reply-1
,或者更有意义的:/threads/1# post-1
),或者(如果您认为它对您的用户有用)我会创建一个页面,仅包含回复(带有返回完整线程的链接)。
关于seo - rel=self 是用于论坛永久链接的正确 rel 标签吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39811077/
我已经阅读了一些相关内容,但无法在任何地方找到明确的答案。所以,我想在这里问这个问题。 我正在构建一个旅游指南,其中包含大量分为标签的信息。每个选项卡都有自己的内容和关键字,我想在 SEO 中对其进行
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 7 年前。 Improve
显然,来自具有高网页排名的网站的链接有助于根据 SEO 对网站进行定位。我想知道如果链接“链接”到将您重定向到目标网站的网站,是否也是如此?或者爬虫会忽略重定向(通过 javascript 还是 ph
关闭。这个问题是off-topic .它目前不接受答案。 想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。 8 年前关闭。 Improve this
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
我们有一个网站 site.com,希望其他国家/地区的用户可以更快地访问该网站。想法是在每个大陆都有一个主机,并通过 GeoIP 重定向到该主机,例如:eu.site.com - 欧洲,us.site
我想将表格放在页面的页脚中,并使用主页面中的“联系”链接 作为 的 anchor . 从 SEO 的角度来看这是否合适,或者我应该放弃这个想法并坚持使用直接的联系页面?还是两者兼而有之? 最佳答案
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 7 年前。 Improve
我想为不同的版本设计不同的 html,但内容相同。我计划通过在选择哪个页面模板作为响应返回之前以编程方式确定请求设备来实现这一点。 我知道那里有响应式模板开发框架,但我们有意识地对走那条路不感兴趣,因
现在什么被认为是 url 结构的最佳实践? 出于某种原因,我认为在 url 末尾包含一个扩展名是一旦你进入层次结构的“最低”部分,例如 /category/sub-category/product.h
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 5 年前。
我在同一页面 上创建了两种不同的布局(使用 Bootstrap )。一种用于移动设备,一种用于桌面设备。网站有不同的页面,结构复杂。一些 block 应该只在桌面上可见,反之亦然。 这是一个示例页面:
如果我有这样一个网站: google.com/index.html?c=123123&p=shoes SEO 将其设置为: google.com/index.html?code=123123&foot
我们有一个网站,它会向后端系统发出昂贵的调用以显示产品可用性。我想消除这些对非实际客户的页面浏览量的调用。我的第一个想法是过滤用户代理,如果请求者是蜘蛛/搜索引擎爬虫,则显示“请求可用性”或类似的消息
我的 Joomla 网站有问题。菜单项的 SEO 可以有效地工作。因此,如果我键入“www.example.com/about”之类的内容,它将起作用并显示相应的文章页面。所以这表明 SEF URL
我看了很多关于 seo 的网络教程,但我从来没有发现一些较大的网站在搜索时如何以及为什么会出现这种情况......我不知道在 quora 和 yahoo 旁边问这个问题,但没有人在那里回答......
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求提供代码的问题必须表现出对所解决问题的最低限度理解。包括尝试过的解决方案、为什么它们不起作用,以及预
与其说是问题,倒不如说是问题。如果你能分辨出谷歌机器人和浏览你网站的其他用户之间的区别,然后你加载不同的内容取决于它是一个还是另一个,谷歌是否可以找到?毕竟,他们不会派人去目视检查。 最佳答案 你说的
我是一名优秀的程序员,十分优秀!