标签: utf-8

由于编码问题,WebClient.DownloadString导致损坏的字符,但浏览器没问题

以下代码:

var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20"));
Run Code Online (Sandbox Code Playgroud)

导致变量text包含字符串等许多内容

"$κ$ -Minkowski空间,标量场和洛伦兹不变性问题"

但是,当我在Firefox中访问该URL时,我得到了

$κ$ -Minkowski空间,标量场和洛伦兹不变性问题

这实际上是正确的.我也试过了

var data = (new WebClient()).DownloadData("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20");
var text = System.Text.UTF8Encoding.Default.GetString(data);
Run Code Online (Sandbox Code Playgroud)

但这给了同样的问题.

我不确定这里的错误在哪里.Feed是否是UTF8编码的,浏览器足够聪明,可以解决这个问题,但不是WebClient吗?Feed是否正确UTF8编码,但是WebClient以其他方式失败了?我该怎么做才能缓解这种情况?

.net unicode webclient utf-8

81
推荐指数
1
解决办法
4万
查看次数

将Visual Studio项目中的所有文件保存为UTF-8

我想知道是否可以将Visual Studio 2008项目中的所有文件保存为特定的字符编码.我得到了一个混合编码的解决方案,我想让它们都一样(带签名的UTF-8).

我知道如何保存单个文件,但项目中的所有文件怎么样?

utf-8 character-encoding visual-studio

80
推荐指数
5
解决办法
8万
查看次数

C编程:如何为Unicode编程?

严格的Unicode编程需要哪些先决条件?

这是否意味着我的代码不应该char在任何地方使用类型,并且需要使用可以处理的函数wint_twchar_t

在这种情况下,多字节字符序列的作用是什么?

c unicode locale utf-8 character-encoding

80
推荐指数
5
解决办法
4万
查看次数

使用'use utf8;' 给了我'印刷品的广泛性'

如果我运行以下Perl程序:

perl -e 'use utf8; print "?\n";'
Run Code Online (Sandbox Code Playgroud)

我收到这个警告:

Wide character in print at -e line 1.
Run Code Online (Sandbox Code Playgroud)

如果我运行这个Perl程序:

perl -e 'print "?\n";'
Run Code Online (Sandbox Code Playgroud)

我没有收到警告.

我认为use utf8需要在Perl脚本中使用UTF-8字符.为什么这不起作用,我该如何解决?我正在使用Perl 5.16.2.我有同样的问题,如果这是在一个文件而不是命令行上的一个班轮.

unicode perl utf-8

80
推荐指数
5
解决办法
6万
查看次数

JSON字符编码 - 浏览器是否支持UTF-8,还是应该使用数字转义序列?

我正在编写一个使用json来表示其资源的web服务,我有点想到编写json的最佳方法.阅读json rfc(http://www.ietf.org/rfc/rfc4627.txt)显然首选的编码是utf-8.但rfc还描述了一种用于指定字符的字符串转义机制.我假设这通常用于转义非ascii字符,从而使得得到的utf-8有效ascii.

所以,假设我有一个json字符串,其中包含非ascii的unicode字符(代码点).我的webservice应该只是utf-8编码并返回它,还是应该逃脱所有那些非ascii字符并返回纯ascii?

我希望浏览器能够使用jsonp或eval执行结果.这会影响决定吗?我对各种浏览器对utf-8的javascript支持的了解很少.

编辑:我想澄清一下,我对如何对结果进行编码的主要关注点是关于结果的浏览器处理.我读过的内容表明,特别是在使用JSONP时,浏览器可能对编码很敏感.我没有找到关于这个主题的任何非常好的信息,所以我将不得不开始做一些测试,看看会发生什么.理想情况下,我只想逃避所需的几个字符,只需对utf-8进行编码即可.

unicode json web-services utf-8

78
推荐指数
5
解决办法
19万
查看次数

不支持Python解码Unicode

我的Python编码问题.我尝试了不同的方法,但我似乎无法找到将输出编码为UTF-8的最佳方法.

这就是我想要做的:

result = unicode(google.searchGoogle(param), "utf-8").encode("utf-8")
Run Code Online (Sandbox Code Playgroud)

searchGoogle返回第一个Google结果param.

这是我得到的错误:

exceptions.TypeError: decoding Unicode is not supported
Run Code Online (Sandbox Code Playgroud)

有谁知道我如何使用UTF-8编码我的输出Python来避免这个错误?

python encoding utf-8 character-encoding

78
推荐指数
1
解决办法
9万
查看次数

如何在CSV文件中编写UTF-8

我试图用PyQt4创建一个csv格式的文本文件QTableWidget.我想用UTF-8编码来编写文本,因为它包含特殊字符.我使用以下代码:

import codecs
...
myfile = codecs.open(filename, 'w','utf-8')
...
f = result.table.item(i,c).text()
myfile.write(f+";")
Run Code Online (Sandbox Code Playgroud)

它一直有效,直到单元格包含特殊字符.我也尝试过

myfile = open(filename, 'w')
...
f = unicode(result.table.item(i,c).text(), "utf-8")
Run Code Online (Sandbox Code Playgroud)

但是当出现特殊字符时它也会停止.我不知道我做错了什么.

python csv encoding utf-8

77
推荐指数
4
解决办法
11万
查看次数

MySQL VARCHAR长度和UTF-8

在MySQL中,如果我VARCHAR(32)在UTF-8表中创建一个新字段,是否意味着我可以在该字段中存储32个字节的数据或32个字符(多字节)?

mysql unicode varchar utf-8

76
推荐指数
3
解决办法
5万
查看次数

如何发送UTF-8电子邮件?

当我发送电子邮件时,电子邮件不会显示英语以外的字符.它确实如下所示:

ä½™C"雅»ä»

实际上可能知道这是什么原因?即使我尝试在脚本中添加Content-type和charset,它仍然显示相同.

我用了 Mail::Factory("mail");

php email utf-8

76
推荐指数
2
解决办法
18万
查看次数

如何从文本文件中删除非UTF-8字符

我有一堆阿拉伯语,英语,俄语文件,用utf-8编码.尝试使用Perl脚本处理这些文件,我收到此错误:

Malformed UTF-8 character (fatal)
Run Code Online (Sandbox Code Playgroud)

手动检查这些文件的内容,我发现其中有一些奇怪的字符.现在我正在寻找一种从文件中自动删除这些字符的方法.

无论如何要做到这一点?

linux bash text utf-8 character-encoding

76
推荐指数
2
解决办法
9万
查看次数