gpt4 book ai didi

sitemap - 我应该在我的站点地图中编码特殊字符吗?

转载 作者:行者123 更新时间:2023-12-02 07:56:49 25 4
gpt4 key购买 nike

我有一些包含特殊字符的 URL。例如:

http://www.example.com/bléèàû.html

如果您在浏览器中键入此 URL,我的 Web 服务器将显示正确的页面(它可以处理特殊字符)。

我看过 sitemaps specs并且不清楚站点地图文件是否可以包含特殊字符。根据我对协议(protocol)的了解,如果 URL 工作正常并且服务器提供正确的页面并且 XML 文件是 UTF-8 编码的,那么就可以了。

例如,此条目是有效的站点地图条目:
   <url>
<loc>http://www.example.com/bléèàû.html</loc>
<changefreq>weekly</changefreq>
</url>

任何人都可以证实这一点?

[更新] 我不愿意对特殊字符进行编码的原因是我不想为相同的内容引入重复的 URL。例如
http://www.example.com/bl%C3%A9%C3%A8%C3%A0%C3%BB.html


http://www.example.com/bléèàû.html

将提供相同的页面。我认为 Google 会通过其正常索引和站点地图同时捕获 URL。不幸的是,谷歌倾向于降低具有指向同一页面的重复 URL 的网站的页面排名。

最佳答案

站点地图规范没有说。它显示了各种转义形式的 URL 示例,但没有明确说明第一个示例(原始字符)是否允许。它只称它们为“URL”,没有提及“URL”或 RFC 的特定定义,这将阐明它们是指老式的 ASCII URI 还是 IRI(可能包含非 ASCII 字符)。

因此,对 URL 的 UTF-8 编码进行 %-escape 是最安全的。然后该链接将在全局范围内工作,并且应该在所有现代浏览器中作为 Unicode 字符呈现给用户。

<loc>http://www.example.com/bl%C3%A9%C3%A8%C3%A0%C3%BB.html</loc>

关于sitemap - 我应该在我的站点地图中编码特殊字符吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/533465/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com