Ada*_*nch 6 java sitemap encoding character-encoding google-webmaster-tools
我有一个为Google网站站长工具生成XML站点地图的程序(除其他外).
GWT为我提供了一些站点地图的错误,因为URL包含¾,ã<,ã等字符序列.**
GWTs说:
我们要求您的Sitemap文件采用UTF-8编码(通常可以在保存文件时执行此操作).与所有XML文件一样,任何数据值(包括URL)都必须使用字符的实体转义码:&,',",<,>.
特殊字符在XML文件中展开(使用HTML实体).
XML文件片段:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://domain/folder/listing-ã.shtml</loc>
...
Run Code Online (Sandbox Code Playgroud)
我的网址是UTF-8编码的吗?
如果没有,我如何用Java做到这一点?
以下是我的程序中的行,我将URL添加到站点地图:
siteMap.addUrl(StringEscapeUtils.escapeXml(countryName+"/"+twoCharFile.getRelativeFileName().toLowerCase()));
Run Code Online (Sandbox Code Playgroud)
**=我不确定哪些是导致错误的,可能是前两个例子.
我为所有的编辑道歉.
Jai*_*Jai 17
尝试使用URLEncoder.encode(stringToBeEncoded, "UTF-8")
编码网址.
归档时间: |
|
查看次数: |
41497 次 |
最近记录: |