gpt4 book ai didi

java - 使 gwt 网站在没有哈希符号的情况下可抓取?

转载 作者:行者123 更新时间:2023-12-05 00:07:22 25 4
gpt4 key购买 nike

在 GWT 中,我们需要在 URL 中使用 # 来从一个页面导航到另一个页面,即为例如创建历史记录。 www.abc.com/#questions/10245857 但由于这个原因,我在共享 url 时遇到了问题。 Google 抓取器仅读取 # 之前的 url,即 www.abc.com

现在我想从我的网址中删除 # 并希望将其保持为 www.abc.com/question/10245857

我做不到。我该怎么做?

当用户浏览应用程序时,我使用哈希 url 和历史记录对象(如不重新加载页面)。然而有时它很好/需要有一个漂亮的 URL(例如用于共享、公开展示等)所以我想知道如何提供同一页面的漂亮 URL。

注意:
我们必须这样做才能使我们的网页 url 可抓取并将该网站与外界链接起来。

最佳答案

这里有3个问题,每个都可以解决:

  1. URL 对用户来说应该更漂亮
  2. 直接转到漂亮的 URL 应该可行。
  3. WebCrawlers应该能够获取内容

这些可能看起来都是同一个问题,但在这种情况下它们是截然不同的。

显示漂亮的 URL

可以用一个使用 HTML5 state methods 的小 javascript 文件来完成.可以看一个简单的demo here , 与 source here .这使得对“#”的所有更改都在没有“#”的情况下显示(在现代浏览器上)。

fiddle的相关代码:

var stateObj = {locationHash: hash};
history.replaceState(stateObj, "Page Title", baseURL + hash.substring(1));

响应漂亮的 URL

这相对简单,只要您在 GWT 中有一个监听器即可在页面加载时基于“#”进行加载。您可以抛出一个简单的重定向 servlet,它会在收到请求时将“#”标记重新插入到它所属的位置。

对于 servlet,监听漂亮的 URL:

if(request.getPathInfo()!=null && request.getPathInfo().length()>1){
response.sendRedirect("#" + request.getPathInfo());
return;
}

或者,您可以直接从此 servlet 提供 GWT 应用程序,并使用 URL 中的参数对其进行初始化,但需要注意一些相对路径簿记。

网络爬虫

这是最棘手的一个。基本上你无法绕过这里的静态(ish)页面。如果您正在索引一组有限的简单状态,那并不太难。一个简单的方案是有一个单独的 servlet,它以最小格式的 HTML 返回您通常使用 GWT 获取的原始内容。这个 servlet 可以有不同的 URL 模式,比如“/indexing/”。这些不适用于人类,仅适用于网络爬虫。您可以在 中附加一个简单的 javascript,以便在页面加载后将用户重定向到漂亮的 url。

下面是此类 servlet 的 doGet 方法的示例:

response.setContentType("text/html;charset=UTF-8");
response.setStatus(200);
pw = response.getWriter();
pw.println("<html>");
pw.println("<head><script>");
pw.println("window.location.href='http://www.example.com/#"
+ request.getPathInfo() + "';");
pw.println("</script></head>");
pw.println("<body>");
pw.println(getRawPageContent(request.getPathInfo()));
pw.println("</body>");
pw.println("</html>");
pw.flush();
pw.close();
return;

然后,您应该将一些指向这些索引页面的链接隐藏在您的主应用 URL 中的某处(或在您的主应用 URL 上的链接后面)。

关于java - 使 gwt 网站在没有哈希符号的情况下可抓取?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25522085/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com