gpt4 book ai didi

gwt - 索引重定向 onload 的 HTML 页面

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:45:57 24 4
gpt4 key购买 nike

我有一个纯基于 GWT 的网站,我们知道搜索引擎无法索引纯基于 GWT 的网站。因此,我创建了一个备用网页,如下所示,它作为单独的 html 存储在 war 文件夹中。此网页的目的是征集和索引有关我的网站的详细信息。此页面从未显示在我的网站上,而是仅用于索引。指向此网页的 url 是 Sitemaps.xml 的一部分。因此,我假设以下 html 将被编入索引,因为它是站点地图的一部分。所以这是我的问题:

  1. 我在 ID 为“crawler”的 div 中提供的内容是否会被编入索引,因为它计划在加载时删除并且浏览器在加载时被重定向到另一个 url?

  2. 有没有更好的方法来为没有任何基于 html 的用户界面的纯 GWT 网站编制内容索引?

  3. 我还可以拥有将调用 servlet 并返回用于编制索引的响应的 url。但是搜索结果中会显示相同的 url,这是没有用的。换句话说,我正在尝试找出一种将内容编入索引的方法,但是当用户单击搜索结果时,他应该被重定向到主页而不是显示编入索引的内容。

<head>
<script>
function load(){
element = document.getElementById("crawler");
element.parentNode.removeChild(element);
window.location.href='http://<mysite>.com';
}
</script>
</head>
<body onLoad='load()'>
<div id="crawler">
<CONTENT TO BE INDEXED>......
</div>
</body>

正如您在此处看到的,包含用于索引的所有内容的 div(爬虫)在主体加载后立即被删除。除此之外,该页面还会重定向到加载时网站的主页。

最佳答案

爬虫将读取页面的全部内容以进行索引,因此它可以毫不费力地提取 div 中的部分。在读取页面之前,爬虫不会执行 onload。

我过去使用的一种方法是生成页面的静态 html 版本并通过 sitemap.xml 引用它们。登陆 html 页面的用户在单击链接(即:购买或规范)时将被定向到等效的动态页面。这对于搜索引擎排名非常有效,许多页面出现在前十名中。

关于gwt - 索引重定向 onload 的 HTML 页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16593697/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com