gpt4 book ai didi

java - 正确生成带有特殊字符的站点地图 XML

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:41:09 25 4
gpt4 key购买 nike

我有一个程序可以为 Google 网站站长工具(除其他外)生成 XML 站点地图。
GWTs 给我一些站点地图的错误,因为 URL 包含 ã¾、ã‹、〠等字符序列。**

Sitemap specification says :

Your Sitemap file must be UTF-8 encoded (you can generally do this when you save the file). As with all XML files, any data values (including URLs) must use entity escape codes for the characters listed: &, ', ", <, >.

特殊字符在 XML 文件(带有 HTML 实体)中被转义。 XML 文件片段:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://domain/folder/listing-&#227;&#129;.shtml</loc>
...

我的网址是否采用 UTF-8 编码?如果没有,我如何在 Java 中执行此操作?以下是我将 URL 添加到站点地图的程序行:

    siteMap.addUrl(StringEscapeUtils.escapeXml(countryName+"/"+twoCharFile.getRelativeFileName().toLowerCase()));

我不确定是哪些导致了错误,可能是前两个示例。

最佳答案

尝试使用 URLEncoder.encode(stringToBeEncoded, "UTF-8") 对 url 进行编码。

关于java - 正确生成带有特殊字符的站点地图 XML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6096550/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com