unicode在java中显示字符显示“?” 标志。例如,我试图打印“?”。其unicode编号为 U+0905,html 表示为“अ”。下面的代码打印“?” 而不是unicode性格。
char aa = '\u0905';
String myString = aa + " result" ;
System.out.println(myString); // displays "? result"
Run Code Online (Sandbox Code Playgroud)
有没有办法unicode直接从unicode自身显示字符而不使用unicode数字?IE ”?” 保存在文件中现在在jsp中显示文件。
假设我有一个字符串
var a = "#bb #cccc #ddddd\u{ef}"
Run Code Online (Sandbox Code Playgroud)
我将它设置为这样的 textview
let text = a.trimmingCharacters(in: .whitespacesAndNewlines)
let textRemoved = text?.replacingOccurrences(of: "\u{ef}", with: "", options: NSString.CompareOptions.literal, range:nil)
textView.text = textRemove
Run Code Online (Sandbox Code Playgroud)
我正在尝试删除\u{ef}这里的字符。但textRemoved它并没有发生。请帮我怎么做。
我正在使用 Xcode 10。看起来 Xcode 版本低于 10 工作正常。这是 Xcode 10 的错误吗?
My App 在 TextBox 和 LinkLabel 上显示英文、日文和中文字符。目前,我检查是否有 unicode 字符并将字体更改为 MS Mincho,否则将其保留在 Tahoma 中。
现在 MS Mincho 可以正确显示日语,但是对于中文我必须使用 Sim Sun。我如何区分两者?
无论字体/语言如何,如何确保 unicode 文本都能正确显示?
我正在阅读一些关于 Unicode 的问题,其中有一些我不完全理解的评论,例如:
Dean Harding:UTF-8是一种变长编码,处理起来比定长编码更复杂。另外,请参阅我对 Gumbo 答案的评论:基本上,所有编码(UTF-8、UTF-16 和 UTF-32)中都存在组合字符,并且它们需要特殊处理。您可以使用与组合字符相同的特殊处理来处理 UTF-16 中的代理项对,因此在大多数情况下您可以忽略代理项并将 UTF-16 视为固定编码。
我对最后一部分(“大部分”)有点困惑。如果UTF-16被视为固定的16位编码,这会导致什么问题?存在 BMP 之外的字符的可能性有多大?如果存在,如果您假设为两字节字符,这可能会导致什么问题?
我阅读了关于代孕者的维基百科信息,但它并没有真正让我更清楚事情!
编辑:我想我真正的意思是“为什么有人建议将 UTF-16 视为固定编码,而它看起来是假的?”
编辑2:
我在“ Is There Any Reasons to Preferred UTF-16 over UTF-8? ”中找到了另一条评论,我认为这更好地解释了这一点:
Andrew Russell:就性能而言:UTF-8 比 UTF-16 更难解码。在 UTF-16 中,字符要么是基本多语言平面字符(2 字节),要么是代理对(4 字节)。UTF-8 字符可以是 1 到 4 个字节之间的任意位置
这表明 UTF-16 不会有任何三字节字符,因此通过假设 16 位,您不会因减少一个字节而“完全搞砸”。但我仍然不相信这与假设 UTF-8 是单字节字符有什么不同!
我试图打印unicode字符给他们的名字如下:
# -*- coding: utf-8 -*-
print "\N{SOLIDUS}"
print "\N{BLACK SPADE SUIT}"
Run Code Online (Sandbox Code Playgroud)
然而,我得到的输出并不是很令人鼓舞.
转义序列按原样打印.
ActivePython 2.7.2.5 (ActiveState Software Inc.) based on
Python 2.7.2 (default, Jun 24 2011, 12:21:10) [MSC v.1500 32 bit (Intel)] on
Type "help", "copyright", "credits" or "license" for more information.
>>> # -*- coding: utf-8 -*-
... print "\N{SOLIDUS}"
\N{SOLIDUS}
>>> print "\N{BLACK SPADE SUIT}"
\N{BLACK SPADE SUIT}
>>>
Run Code Online (Sandbox Code Playgroud)
然而,我可以看到另一个提问者已经能够成功地做到这一点.
怎么了?
我有一个希伯来语文本"×??¸×¨?´×™×??°×?ו?¹×?",我想将它转换为可读的 unicode 希伯来语字符。
我试过这个代码:
const string Str = "×??¸×¨?´×™×??°×?ו?¹×?";
Encoding enc1 = Encoding.Default;
Encoding enc2 = Encoding.Unicode;
byte[] bytes = enc1.GetBytes(Str);
string hebrewString = enc2.GetString(bytes);
label1.Text = hebrewString;
Run Code Online (Sandbox Code Playgroud)
但它没有成功。请帮忙。
更新 文本来自html源代码
Version:1.0
StartHTML:000000210
EndHTML:000006218
StartFragment:000001595
EndFragment:000006126
StartSelection:000001595
EndSelection:000006126
SourceURL:file:///C:/ProgramData/Babylon/LocalUI/wnd.html
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3c.org/TR/1999/REC- html401-19991224/loose.dtd">
<HTML
xmlns="http://www.w3.org/1999/xhtml"><HEAD><TITLE>CLient build #1.2</TITLE><LINK
rel=stylesheet type=text/css href="img/frame.css?ver=41"><LINK rel=stylesheet
type=text/css href="img/baby.css?ver=41"><LINK rel=stylesheet type=text/css
href="img/word.css?ver=41"><LINK rel=stylesheet type=text/css
href="img/text.css?ver=41">
<SCRIPT type=text/javascript src="js/moudles.js?ver=100"></SCRIPT>
<SCRIPT type=text/javascript src="js/extrnl.js?ver=100"></SCRIPT>
<SCRIPT type=text/javascript src="js/frame.js?ver=100"></SCRIPT>
<SCRIPT type=text/javascript src="js/word.js?ver=100"></SCRIPT>
<SCRIPT type=text/javascript …Run Code Online (Sandbox Code Playgroud) 我很好奇Delphi 2010中这段代码会发生什么:
function foo: WideString;
var
myUnicodeString: UnicodeString;
begin
for i:=1 to 1000 do
begin
myUnicodeString := ... something ...;
result := result + myUnicodeString; // This is where I'm interested
end;
end;
Run Code Online (Sandbox Code Playgroud)
涉及多少字符串转换,是否有任何特别糟糕的性能?
我知道该函数应该只返回一个UnicodeString,但我在VCL流代码中看到了这种反模式,并希望了解该过程.
我正在尝试获取其中包含 unicode 的电子邮件地址。就像\xd0\xb5\xd0\xba\xd0\xb7\xd0\xb0\xd0\xbc\xd0\xbf\xd0\xbb@example.com。我尝试过中文网站(http://www.sina.com.cn/)、gmail.com,甚至我自己的namecheap 托管网站。它们都只要求 ASCII 字符。我正在尝试测试和更新库,但想测试其中包含 unicode 的真实电子邮件地址。
\n我正在尝试使用 cpanfile 和 cpanm 来安装大量模块。其中一个模块 Unicode::String 在 CPAN 上有一个错误,作者仅在 Github 上修复了该错误。(https://github.com/msouth/Unicode-String)
是否可以将 Github 存储库列为 cpanfile 中的要求,并从那里而不是从 CPAN 安装 cpanm?如果是这样,这样做的正确语法是什么?
我发现的最接近的是 2013 年的一条线索,宫川说它将在未来的版本中推出,然后未来的版本很脆弱并且被搁置:
https://github.com/perl-carton/carton/issues/132 (这里讨论 carton,但由于它们都使用 cpanfile,因此语法应该相同。)
根据维基百科,2017 年,使用大写字母\xe1\xba\x9e(Unicode U+1E9E) 被正式采用——至少作为一种选择——实际上可能是德语中全大写单词的子集:
同年 6 月,德国正字法委员会正式通过了一项规则,\xe2\x9f\xa8\xe1\xba\x9e\xe2\x9f\xa9 将成为 \xe2\x9f\xa8\xc3\x9f 大写的选项\xe2\x9f\xa9 除了之前的大写形式 \xe2\x9f\xa8SS\xe2\x9f\xa9 之外(即变体 STRASSE 和 STRA\xe1\xba\x9eE 将被视为同等有效)。2
\n似乎对德语的这一补充将大大简化字符串之间的大小写比较(所谓的“大小写折叠”或“折叠大小写”比较)。注意,我开始这个询问是为了理解 Raku(又名 Perl6)的实现,但实际上这个问题似乎可以推广到其他编程语言。这是 Raku 的默认实现 - 从rfdr_Regeln_2017.pdf中的 13 个单词开始,这些单词已小写(通过 Raku 的.lc函数):
~$ cat TO_\xe1\xba\x9e_OR_NOT_TO_\xe1\xba\x9e.txt\nma\xc3\x9f stra\xc3\x9fe grie\xc3\x9f spie\xc3\x9f gro\xc3\x9f gr\xc3\xbc\xc3\x9fen au\xc3\x9fen au\xc3\x9fer drau\xc3\x9fen strau\xc3\x9f bei\xc3\x9fen flei\xc3\x9f hei\xc3\x9fen\n~$ raku -ne \'.words>>.match(/^ <:Ll>+ $/).say;\' TO_\xe1\xba\x9e_OR_NOT_TO_\xe1\xba\x9e.txt\n(\xef\xbd\xa2ma\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2stra\xc3\x9fe\xef\xbd\xa3 \xef\xbd\xa2grie\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2spie\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2gro\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2gr\xc3\xbc\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2au\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2au\xc3\x9fer\xef\xbd\xa3 \xef\xbd\xa2drau\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2strau\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2bei\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2flei\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2hei\xc3\x9fen\xef\xbd\xa3)\n~$ raku -ne \'.uc.say;\' TO_\xe1\xba\x9e_OR_NOT_TO_\xe1\xba\x9e.txt\nMASS STRASSE GRIESS …Run Code Online (Sandbox Code Playgroud)