标签: utf-8

如何在Eclipse中支持UTF-8编码

如何在eclipse中添加UTF-8支持?我想添加例如俄语,但eclipse不会支持它.我该怎么办?请指导我.

eclipse encoding utf-8 character-encoding

115
推荐指数
6
解决办法
19万
查看次数

Outlook自动清理我的换行符并搞砸了我的电子邮件格式

我正在使用dotnet框架发送电子邮件.这是我用来创建消息的模板:

Date of Hire: %HireDate%
Annual Salary: %AnnualIncome%
Reason for Request: %ReasonForRequest%

Name of Voluntary Employee: %FirstName% %LastName%
Total Coverage Applied For:  %EECoverageAmount%
Guaranteed Coverage Portion: %GICoveragePortion%
Amount Subject to Medical Evident: %GIOverage%
Run Code Online (Sandbox Code Playgroud)

在Outlook中收到消息时,outlook告诉我"此消息中的额外换行符已被删除".消息显示如下:

Date of Hire: 9/28/2001
Annual Salary: $100,000
Reason for Request: New Hire

Name of Voluntary Employee: Ronald Weasley Total Coverage Applied For:  $500,000 Guaranteed Coverage Portion: $300,000.00 Amount Subject to Medical Evident: $200,000
Run Code Online (Sandbox Code Playgroud)

请注意Outlook如何在名称,EECoverageAmount等之后错误地删除所需的换行符...

对于电子邮件接收者来说,获取格式正确的电子邮件非常重要,我必须假设其中一些使用outlook 2003.我也不能假设他们知道足以关闭autoclean功能以使消息正确格式化.

我在其他邮件客户端中查看了这些邮件并正确显示

更多信息:

  • 我使用的是UTF-8 BodyEncoding(msg.BodyEncoding = System.Text.Encoding.UTF8)
  • 正在从UTF-8编码的文本文件中读取msg.Body,并且每行都以crlf终止.

问题:如何更改邮件格式以避免此问题?

.net outlook smtp utf-8

112
推荐指数
5
解决办法
5万
查看次数

ruby 1.9:UTF-8中的无效字节序列

我在Ruby(1.9)中编写了一个爬虫程序,它从很多随机站点中消耗了大量的HTML.
当试图提取链接时,我决定使用.scan(/href="(.*?)"/i)而不是nokogiri/hpricot(主要加速).问题是我现在收到很多" invalid byte sequence in UTF-8"错误.
根据我的理解,该net/http库没有任何特定于编码的选项,并且所引入的内容基本上没有正确标记.
实际使用传入数据的最佳方法是什么?我尝试.encode使用替换和无效选项集,但到目前为止没有成功...

ruby encoding utf-8

109
推荐指数
5
解决办法
12万
查看次数

u'\ ufeff'在Python字符串中

我得到了以下模式的错误:

UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)

不知道是什么u'\ufeff',它在网络抓取时显示出来.我该如何纠正这种情况?该.replace()字符串的方法不能进行这项工作.

python unicode utf-8

109
推荐指数
3
解决办法
13万
查看次数

在MySQL中设置名称utf8?

我经常在使用MySQL的PHP​​脚本中看到类似于下面的内容

query("SET NAMES utf8");   
Run Code Online (Sandbox Code Playgroud)

我从来没有为任何项目做过这个,所以我有几个关于它的基本问题.

  1. 这只是用PDO完成的吗?
  2. 如果它不是PDO特定的东西,那么这样做的目的是什么?我意识到它正在设置mysql的编码,但我的意思是,我从来没有使用它,所以为什么我要使用它?

php mysql utf-8

108
推荐指数
6
解决办法
36万
查看次数

Java中的"用于编码的不可映射字符"警告

我正在编写一个Java项目,在编译时发出以下警告:

/src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8
    [javac]         String copyright = "? 2003-2008 My Company. All rights reserved.";
Run Code Online (Sandbox Code Playgroud)

我不确定SO会如何在日期之前渲染角色,但它应该是版权符号,并在警告中显示为钻石中的问号.

值得注意的是,角色正确地出现在输出工件中,但警告是令人讨厌的,包含此类的文件可能有一天会被文本编辑器触及,这会错误地保存编码...

如何将此字符注入"copyright"字符串,以便编译器满意,并且该符号保留在文件中而没有潜在的重新编码问题?

java encoding ascii utf-8

106
推荐指数
8
解决办法
19万
查看次数

对Unicode字符进行URL编码的正确方法是什么?

我知道非标准的%uxxxx方案,但这似乎不是明智的选择,因为该方案已被W3C拒绝.

一些有趣的例子:

心中的人物.如果我在浏览器中输入:

http://www.google.com/search?q=?
Run Code Online (Sandbox Code Playgroud)

然后复制并粘贴它,我看到这个URL

http://www.google.com/search?q=%E2%99%A5
Run Code Online (Sandbox Code Playgroud)

这使得它看起来像Firefox(或Safari)正在这样做.

urllib.quote_plus(x.encode("latin-1"))
'%E2%99%A5'
Run Code Online (Sandbox Code Playgroud)

这是有道理的,除了不能用Latin-1编码的东西,比如三点字符.

Run Code Online (Sandbox Code Playgroud)

如果我输入URL

http://www.google.com/search?q=…
Run Code Online (Sandbox Code Playgroud)

进入我的浏览器然后复制粘贴,我明白了

http://www.google.com/search?q=%E2%80%A6
Run Code Online (Sandbox Code Playgroud)

背部.这似乎是做的结果

urllib.quote_plus(x.encode("utf-8"))
Run Code Online (Sandbox Code Playgroud)

这是有道理的,因为...不能用Latin-1编码.

但后来我不清楚浏览器是如何用UTF-8或Latin-1解码的.

因为这似乎含糊不清:

In [67]: u"…".encode('utf-8').decode('latin-1')
Out[67]: u'\xc3\xa2\xc2\x80\xc2\xa6'
Run Code Online (Sandbox Code Playgroud)

有效,所以我不知道浏览器是如何用UTF-8或Latin-1解码的.

使用我需要处理的特殊字符做什么是正确的?

unicode urlencode web-standards utf-8 character-encoding

106
推荐指数
4
解决办法
10万
查看次数

字节顺序标记用Java解压缩文件读取

我正在尝试使用Java读取CSV文件.一些文件在开头可能有一个字节顺序标记,但不是全部.当存在时,字节顺序与第一行的其余部分一起被读取,从而导致字符串比较出现问题.

是否有一种简单的方法可以跳过字节顺序标记?

谢谢!

java byte-order-mark utf-8

106
推荐指数
6
解决办法
7万
查看次数

如何从Perl输出UTF-8?

我正在尝试使用"utf8"编译指示编写Perl脚本,并且我得到了意想不到的结果.我正在使用Mac OS X 10.5(Leopard),我正在使用TextMate进行编辑.我的编辑器和操作系统的所有设置都默认为以utf-8格式写入文件.

但是,当我在文本文件中输入以下内容时,将其保存为".pl"并执行它,我得到友好的"带问号的菱形"代替非ASCII字符.

#!/usr/bin/env perl -w

use strict;
use utf8;

my $str = 'Çirçös';
print( "$str\n" );
Run Code Online (Sandbox Code Playgroud)

知道我做错了什么吗?我希望在输出中得到"Çirçös",但我得到' ir s'.

unicode perl utf-8

104
推荐指数
3
解决办法
12万
查看次数

如何使用vim将我的文件转换为utf8?

我有一个文本文件.我被告知要把它变成UTF8.我怎么能用Vim做到这一点?

vim utf-8

104
推荐指数
2
解决办法
5万
查看次数