UTF-8编码URL

Ada*_*nch 6 java sitemap encoding character-encoding google-webmaster-tools

信息:

我有一个为Google网站站长工具生成XML站点地图的程序(除其他外).
GWT为我提供了一些站点地图的错误,因为URL包含¾,ã<,ã等字符序列.**

GWTs说:

我们要求您的Sitemap文件采用UTF-8编码(通常可以在保存文件时执行此操作).与所有XML文件一样,任何数据值(包括URL)都必须使用字符的实体转义码:&,',",<,>.

特殊字符在XML文件中展开(使用HTML实体).
XML文件片段:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://domain/folder/listing-&#227;&#129;.shtml</loc>
        ...
Run Code Online (Sandbox Code Playgroud)

我的网址是UTF-8编码的吗?

如果没有,我如何用Java做到这一点
以下是我的程序中的行,我将URL添加到站点地图:

    siteMap.addUrl(StringEscapeUtils.escapeXml(countryName+"/"+twoCharFile.getRelativeFileName().toLowerCase()));
Run Code Online (Sandbox Code Playgroud)

**=我不确定哪些是导致错误的,可能是前两个例子.

我为所有的编辑道歉.

Jai*_*Jai 17

尝试使用URLEncoder.encode(stringToBeEncoded, "UTF-8")编码网址.

  • 这将`application/x-www-form-urlencoded`编码字符串.这通常仅适用于查询部分中使用的参数.例如,它不会正确编码路径部分段. (3认同)