标签: unicode-string

在java中打印unicode字符

unicode在java中显示字符显示“？” 标志。例如，我试图打印“？”。其unicode编号为 U+0905，html 表示为“अ”。下面的代码打印“？” 而不是unicode性格。

char aa = '\u0905';
String myString = aa + " result" ;
System.out.println(myString); // displays "? result"

Run Code Online (Sandbox Code Playgroud)

有没有办法unicode直接从unicode自身显示字符而不使用unicode数字？IE ”？” 保存在文件中现在在jsp中显示文件。

java unicode utf-8 unicode-string

Red*_*one

2017 07-03

6
推荐指数

2
解决办法

3万
查看次数

如何从 String Swift 中删除 '\u{ef}' 字符

假设我有一个字符串

var a = "#bb #cccc #ddddd\u{ef}"

Run Code Online (Sandbox Code Playgroud)

我将它设置为这样的 textview

let text = a.trimmingCharacters(in: .whitespacesAndNewlines)
let textRemoved = text?.replacingOccurrences(of: "\u{ef}", with: "", options: NSString.CompareOptions.literal, range:nil)
textView.text = textRemove

Run Code Online (Sandbox Code Playgroud)

我正在尝试删除\u{ef}这里的字符。但textRemoved它并没有发生。请帮我怎么做。

我正在使用 Xcode 10。看起来 Xcode 版本低于 10 工作正常。这是 Xcode 10 的错误吗？

string unicode-string ios swift

Jas*_*rne

2019 03-19

6
推荐指数

2
解决办法

3086
查看次数

在 C# 中显示 unicode 文本

My App 在 TextBox 和 LinkLabel 上显示英文、日文和中文字符。目前，我检查是否有 unicode 字符并将字体更改为 MS Mincho，否则将其保留在 Tahoma 中。

现在 MS Mincho 可以正确显示日语，但是对于中文我必须使用 Sim Sun。我如何区分两者？

无论字体/语言如何，如何确保 unicode 文本都能正确显示？

c# unicode internationalization unicode-string winforms

Mug*_*nth

lucky-day

5
推荐指数

1
解决办法

8100
查看次数

将 UTF-16 视为固定的 16 位编码会产生什么问题？

我正在阅读一些关于 Unicode 的问题，其中有一些我不完全理解的评论，例如：

Dean Harding：UTF-8是一种变长编码，处理起来比定长编码更复杂。另外，请参阅我对 Gumbo 答案的评论：基本上，所有编码（UTF-8、UTF-16 和 UTF-32）中都存在组合字符，并且它们需要特殊处理。您可以使用与组合字符相同的特殊处理来处理 UTF-16 中的代理项对，因此在大多数情况下您可以忽略代理项并将 UTF-16 视为固定编码。

我对最后一部分（“大部分”）有点困惑。如果UTF-16被视为固定的16位编码，这会导致什么问题？存在 BMP 之外的字符的可能性有多大？如果存在，如果您假设为两字节字符，这可能会导致什么问题？

我阅读了关于代孕者的维基百科信息，但它并没有真正让我更清楚事情！

编辑：我想我真正的意思是“为什么有人建议将 UTF-16 视为固定编码，而它看起来是假的？”

编辑2：

我在“ Is There Any Reasons to Preferred UTF-16 over UTF-8? ”中找到了另一条评论，我认为这更好地解释了这一点：

Andrew Russell：就性能而言：UTF-8 比 UTF-16 更难解码。在 UTF-16 中，字符要么是基本多语言平面字符（2 字节），要么是代理对（4 字节）。UTF-8 字符可以是 1 到 4 个字节之间的任意位置

这表明 UTF-16 不会有任何三字节字符，因此通过假设 16 位，您不会因减少一个字节而“完全搞砸”。但我仍然不相信这与假设 UTF-8 是单字节字符有什么不同！

unicode utf-16 unicode-string

Dan*_*eny

2023 01-02

5
推荐指数

1
解决办法

1102
查看次数

Python转义序列\ N {name}不能按照定义工作

我试图打印unicode字符给他们的名字如下:

# -*- coding: utf-8 -*-
print "\N{SOLIDUS}"
print "\N{BLACK SPADE SUIT}"

Run Code Online (Sandbox Code Playgroud)

然而,我得到的输出并不是很令人鼓舞.

转义序列按原样打印.

ActivePython 2.7.2.5 (ActiveState Software Inc.) based on
Python 2.7.2 (default, Jun 24 2011, 12:21:10) [MSC v.1500 32 bit (Intel)] on
Type "help", "copyright", "credits" or "license" for more information.
>>> # -*- coding: utf-8 -*-
... print "\N{SOLIDUS}"
\N{SOLIDUS}
>>> print "\N{BLACK SPADE SUIT}"
\N{BLACK SPADE SUIT}
>>>

Run Code Online (Sandbox Code Playgroud)

然而,我可以看到另一个提问者已经能够成功地做到这一点.

怎么了？

python unicode unicode-string python-2.7 python-unicode

alo*_*lok

2017 05-23

5
推荐指数

1
解决办法

4955
查看次数

概率。关于希伯来语编码

我有一个希伯来语文本"×??¸×¨?´×™×??°×?×•?¹×?"，我想将它转换为可读的 unicode 希伯来语字符。

我试过这个代码：

const string Str = "×??¸×¨?´×™×??°×?×•?¹×?";

Encoding enc1 = Encoding.Default;
Encoding enc2 = Encoding.Unicode;

byte[] bytes = enc1.GetBytes(Str);

string hebrewString = enc2.GetString(bytes);

label1.Text = hebrewString;

Run Code Online (Sandbox Code Playgroud)

但它没有成功。请帮忙。

更新文本来自html源代码

Version:1.0
StartHTML:000000210
EndHTML:000006218
StartFragment:000001595
EndFragment:000006126
StartSelection:000001595
EndSelection:000006126
SourceURL:file:///C:/ProgramData/Babylon/LocalUI/wnd.html
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3c.org/TR/1999/REC-    html401-19991224/loose.dtd">

<HTML 
xmlns="http://www.w3.org/1999/xhtml"><HEAD><TITLE>CLient build #1.2</TITLE><LINK 
rel=stylesheet type=text/css href="img/frame.css?ver=41"><LINK rel=stylesheet 
type=text/css href="img/baby.css?ver=41"><LINK rel=stylesheet type=text/css 
href="img/word.css?ver=41"><LINK rel=stylesheet type=text/css 
href="img/text.css?ver=41">
<SCRIPT type=text/javascript src="js/moudles.js?ver=100"></SCRIPT>

<SCRIPT type=text/javascript src="js/extrnl.js?ver=100"></SCRIPT>

<SCRIPT type=text/javascript src="js/frame.js?ver=100"></SCRIPT>

<SCRIPT type=text/javascript src="js/word.js?ver=100"></SCRIPT>

<SCRIPT type=text/javascript …

Run Code Online (Sandbox Code Playgroud)

c# character-encoding unicode-string hebrew

Jus*_*tMe

2017 05-29

5
推荐指数

1
解决办法

1636
查看次数

在Delphi中将UnicodeString附加到WideString

我很好奇Delphi 2010中这段代码会发生什么:

function foo: WideString;
var 
   myUnicodeString: UnicodeString; 
begin
  for i:=1 to 1000 do
  begin
    myUnicodeString := ... something ...;

    result := result + myUnicodeString;  // This is where I'm interested
  end;
end;

Run Code Online (Sandbox Code Playgroud)

涉及多少字符串转换,是否有任何特别糟糕的性能？

我知道该函数应该只返回一个UnicodeString,但我在VCL流代码中看到了这种反模式,并希望了解该过程.

delphi unicode-string widestring

Rod*_*ddy

2013 08-15

5
推荐指数

1
解决办法

1383
查看次数

我正在尝试获取其中包含 unicode 的电子邮件地址。就像\xd0\xb5\xd0\xba\xd0\xb7\xd0\xb0\xd0\xbc\xd0\xbf\xd0\xbb@example.com。我尝试过中文网站（http://www.sina.com.cn/）、gmail.com，甚至我自己的namecheap 托管网站。它们都只要求 ASCII 字符。我正在尝试测试和更新库，但想测试其中包含 unicode 的真实电子邮件地址。

email unicode unicode-string

lit*_*cho

lucky-day

5
推荐指数

1
解决办法

2293
查看次数

是否可以在 cpanm 文件中要求 git 存储库？

我正在尝试使用 cpanfile 和 cpanm 来安装大量模块。其中一个模块 Unicode::String 在 CPAN 上有一个错误，作者仅在 Github 上修复了该错误。（https://github.com/msouth/Unicode-String）

是否可以将 Github 存储库列为 cpanfile 中的要求，并从那里而不是从 CPAN 安装 cpanm？如果是这样，这样做的正确语法是什么？

我发现的最接近的是 2013 年的一条线索，宫川说它将在未来的版本中推出，然后未来的版本很脆弱并且被搁置：

https://github.com/perl-carton/carton/issues/132 （这里讨论 carton，但由于它们都使用 cpanfile，因此语法应该相同。）

perl github unicode-string cpanm

Mik*_*Mik

lucky-day

5
推荐指数

1
解决办法

565
查看次数

（德语）下 ß (U+00DF) 和上 ? 之间的折写转换 (U+1E9E)？

根据维基百科，2017 年，使用大写字母\xe1\xba\x9e(Unicode U+1E9E) 被正式采用——至少作为一种选择——实际上可能是德语中全大写单词的子集：

同年 6 月，德国正字法委员会正式通过了一项规则，\xe2\x9f\xa8\xe1\xba\x9e\xe2\x9f\xa9 将成为 \xe2\x9f\xa8\xc3\x9f 大写的选项\xe2\x9f\xa9 除了之前的大写形式 \xe2\x9f\xa8SS\xe2\x9f\xa9 之外（即变体 STRASSE 和 STRA\xe1\xba\x9eE 将被视为同等有效）。2

似乎对德语的这一补充将大大简化字符串之间的大小写比较（所谓的“大小写折叠”或“折叠大小写”比较）。注意，我开始这个询问是为了理解 Raku（又名 Perl6）的实现，但实际上这个问题似乎可以推广到其他编程语言。这是 Raku 的默认实现 - 从rfdr_Regeln_2017.pdf中的 13 个单词开始，这些单词已小写（通过 Raku 的.lc函数）：

~$ cat TO_\xe1\xba\x9e_OR_NOT_TO_\xe1\xba\x9e.txt\nma\xc3\x9f stra\xc3\x9fe grie\xc3\x9f spie\xc3\x9f gro\xc3\x9f gr\xc3\xbc\xc3\x9fen au\xc3\x9fen au\xc3\x9fer drau\xc3\x9fen strau\xc3\x9f bei\xc3\x9fen flei\xc3\x9f hei\xc3\x9fen\n~$ raku -ne \'.words>>.match(/^ <:Ll>+ $/).say;\' TO_\xe1\xba\x9e_OR_NOT_TO_\xe1\xba\x9e.txt\n(\xef\xbd\xa2ma\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2stra\xc3\x9fe\xef\xbd\xa3 \xef\xbd\xa2grie\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2spie\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2gro\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2gr\xc3\xbc\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2au\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2au\xc3\x9fer\xef\xbd\xa3 \xef\xbd\xa2drau\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2strau\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2bei\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2flei\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2hei\xc3\x9fen\xef\xbd\xa3)\n~$ raku -ne \'.uc.say;\' TO_\xe1\xba\x9e_OR_NOT_TO_\xe1\xba\x9e.txt\nMASS STRASSE GRIESS …

Run Code Online (Sandbox Code Playgroud)

string unicode unicode-string string-comparison raku

jub*_*us1

2023 05-01

5
推荐指数

1
解决办法

307
查看次数