- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
背景
我在一家在线媒体公司工作,该公司托管着一个超过 75,000 页的新闻网站。我们目前使用 Google Sitemap Generator(安装在我们的服务器上)为我们的站点构建动态 XML 站点地图。事实上,由于我们有大量内容,所以我们使用站点地图的站点地图。 (Google 只允许最多 50K 个网址。)
问题
站点地图每 12 小时生成一次,并由用户行为驱动。也就是说,它解析服务器日志文件并查看哪些页面被获取最多,并基于此构建站点地图。
既然我们不能保证新页面会添加到站点地图中,那么提交站点地图作为 RSS 提要是否更好?这样,每当我们的一位编辑创建一个新页面(或文章)时,它就会被添加到提要中并提交给谷歌。这带来了将重复内容推送到 google 的问题,因为站点地图和 RSS 提要可能包含相同的 url。谷歌会因为重复的内容而惩罚我们吗?其他内容丰富的网站或媒体网站如何通知谷歌他们正在发布新内容?
我知道 googlebots 只会索引它认为重要和相关的页面,但如果至少抓取我们发布的任何新文章就更好了。
如有任何帮助,我们将不胜感激。
最佳答案
为什么不简单地在您的站点地图中包含每个页面? 75,000 个页面并不是一个很大的数字,很多网站都有几个站点地图,总计数百万个页面,Google 会消化所有这些页面(尽管 Google 只会索引那些它认为重要的页面,正如您指出的那样)。
一种技术是根据发布日期将站点地图拆分为新内容和存档内容 - 例如,一个站点地图包含前 7 天的所有内容,其余内容拆分为其他站点地图文件适当的,这可能有助于快速将您的最新内容编入索引。
回到关于 RSS Feed 站点地图的问题 - 不要担心重复的内容,因为对于站点地图来说这不是问题。只有当您在站点上多次发布同一篇文章时,重复内容才会成为问题 - 站点地图和 RSS 提要只是指向内容的链接,而不是内容本身,所以如果 RSS 提要是最简单的方法如果您想向 Google 报告您的新鲜内容,那就去做吧。
关于seo - 将 RSS 提要作为站点地图提交给 Google?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3505026/
我已经阅读了一些相关内容,但无法在任何地方找到明确的答案。所以,我想在这里问这个问题。 我正在构建一个旅游指南,其中包含大量分为标签的信息。每个选项卡都有自己的内容和关键字,我想在 SEO 中对其进行
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 7 年前。 Improve
显然,来自具有高网页排名的网站的链接有助于根据 SEO 对网站进行定位。我想知道如果链接“链接”到将您重定向到目标网站的网站,是否也是如此?或者爬虫会忽略重定向(通过 javascript 还是 ph
关闭。这个问题是off-topic .它目前不接受答案。 想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。 8 年前关闭。 Improve this
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
我们有一个网站 site.com,希望其他国家/地区的用户可以更快地访问该网站。想法是在每个大陆都有一个主机,并通过 GeoIP 重定向到该主机,例如:eu.site.com - 欧洲,us.site
我想将表格放在页面的页脚中,并使用主页面中的“联系”链接 作为 的 anchor . 从 SEO 的角度来看这是否合适,或者我应该放弃这个想法并坚持使用直接的联系页面?还是两者兼而有之? 最佳答案
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 7 年前。 Improve
我想为不同的版本设计不同的 html,但内容相同。我计划通过在选择哪个页面模板作为响应返回之前以编程方式确定请求设备来实现这一点。 我知道那里有响应式模板开发框架,但我们有意识地对走那条路不感兴趣,因
现在什么被认为是 url 结构的最佳实践? 出于某种原因,我认为在 url 末尾包含一个扩展名是一旦你进入层次结构的“最低”部分,例如 /category/sub-category/product.h
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 5 年前。
我在同一页面 上创建了两种不同的布局(使用 Bootstrap )。一种用于移动设备,一种用于桌面设备。网站有不同的页面,结构复杂。一些 block 应该只在桌面上可见,反之亦然。 这是一个示例页面:
如果我有这样一个网站: google.com/index.html?c=123123&p=shoes SEO 将其设置为: google.com/index.html?code=123123&foot
我们有一个网站,它会向后端系统发出昂贵的调用以显示产品可用性。我想消除这些对非实际客户的页面浏览量的调用。我的第一个想法是过滤用户代理,如果请求者是蜘蛛/搜索引擎爬虫,则显示“请求可用性”或类似的消息
我的 Joomla 网站有问题。菜单项的 SEO 可以有效地工作。因此,如果我键入“www.example.com/about”之类的内容,它将起作用并显示相应的文章页面。所以这表明 SEF URL
我看了很多关于 seo 的网络教程,但我从来没有发现一些较大的网站在搜索时如何以及为什么会出现这种情况......我不知道在 quora 和 yahoo 旁边问这个问题,但没有人在那里回答......
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求提供代码的问题必须表现出对所解决问题的最低限度理解。包括尝试过的解决方案、为什么它们不起作用,以及预
与其说是问题,倒不如说是问题。如果你能分辨出谷歌机器人和浏览你网站的其他用户之间的区别,然后你加载不同的内容取决于它是一个还是另一个,谷歌是否可以找到?毕竟,他们不会派人去目视检查。 最佳答案 你说的
我是一名优秀的程序员,十分优秀!