标签: unicode-string

在java中打印unicode字符

unicode在java中显示字符显示“?” 标志。例如,我试图打印“?”。其unicode编号为 U+0905,html 表示为“अ”。下面的代码打印“?” 而不是unicode性格。

char aa = '\u0905';
String myString = aa + " result" ;
System.out.println(myString); // displays "? result"
Run Code Online (Sandbox Code Playgroud)

有没有办法unicode直接从unicode自身显示字符而不使用unicode数字?IE ”?” 保存在文件中现在在jsp中显示文件。

java unicode utf-8 unicode-string

6
推荐指数
2
解决办法
3万
查看次数

如何从 String Swift 中删除 '\u{ef}' 字符

假设我有一个字符串

var a = "#bb #cccc #ddddd\u{ef}" 
Run Code Online (Sandbox Code Playgroud)

我将它设置为这样的 textview

let text = a.trimmingCharacters(in: .whitespacesAndNewlines)
let textRemoved = text?.replacingOccurrences(of: "\u{ef}", with: "", options: NSString.CompareOptions.literal, range:nil)
textView.text = textRemove
Run Code Online (Sandbox Code Playgroud)

我正在尝试删除\u{ef}这里的字符。但textRemoved它并没有发生。请帮我怎么做。

我正在使用 Xcode 10。看起来 Xcode 版本低于 10 工作正常。这是 Xcode 10 的错误吗?

string unicode-string ios swift

6
推荐指数
2
解决办法
3086
查看次数

在 C# 中显示 unicode 文本

My App 在 TextBox 和 LinkLabel 上显示英文、日文和中文字符。目前,我检查是否有 unicode 字符并将字体更改为 MS Mincho,否则将其保留在 Tahoma 中。

现在 MS Mincho 可以正确显示日语,但是对于中文我必须使用 Sim Sun。我如何区分两者?

无论字体/语言如何,如何确保 unicode 文本都能正确显示?

c# unicode internationalization unicode-string winforms

5
推荐指数
1
解决办法
8100
查看次数

将 UTF-16 视为固定的 16 位编码会产生什么问题?

我正在阅读一些关于 Unicode 的问题,其中有一些我不完全理解的评论,例如:

Dean Harding:UTF-8是一种变长编码,处理起来比定长编码更复杂。另外,请参阅我对 Gumbo 答案的评论:基本上,所有编码(UTF-8、UTF-16 和 UTF-32)中都存在组合字符,并且它们需要特殊处理。您可以使用与组合字符相同的特殊处理来处理 UTF-16 中的代理项对,因此在大多数情况下您可以忽略代理项并将 UTF-16 视为固定编码。

我对最后一部分(“大部分”)有点困惑。如果UTF-16被视为固定的16位编码,这会导致什么问题?存在 BMP 之外的字符的可能性有多大?如果存在,如果您假设为两字节字符,这可能会导致什么问题?

我阅读了关于代孕者的维基百科信息,但它并没有真正让我更清楚事情!

编辑:我想我真正的意思是“为什么有人建议将 UTF-16 视为固定编码,而它看起来是假的?”

编辑2:

我在“ Is There Any Reasons to Preferred UTF-16 over UTF-8? ”中找到了另一条评论,我认为这更好地解释了这一点:

Andrew Russell:就性能而言:UTF-8 比 UTF-16 更难解码。在 UTF-16 中,字符要么是基本多语言平面字符(2 字节),要么是代理对(4 字节)。UTF-8 字符可以是 1 到 4 个字节之间的任意位置

这表明 UTF-16 不会有任何三字节字符,因此通过假设 16 位,您不会因减少一个字节而“完全搞砸”。但我仍然不相信这与假设 UTF-8 是单字节字符有什么不同!

unicode utf-16 unicode-string

5
推荐指数
1
解决办法
1102
查看次数

Python转义序列\ N {name}不能按照定义工作

我试图打印unicode字符给他们的名字如下:

# -*- coding: utf-8 -*-
print "\N{SOLIDUS}"
print "\N{BLACK SPADE SUIT}"
Run Code Online (Sandbox Code Playgroud)

然而,我得到的输出并不是很令人鼓舞.

转义序列按原样打印.

ActivePython 2.7.2.5 (ActiveState Software Inc.) based on
Python 2.7.2 (default, Jun 24 2011, 12:21:10) [MSC v.1500 32 bit (Intel)] on
Type "help", "copyright", "credits" or "license" for more information.
>>> # -*- coding: utf-8 -*-
... print "\N{SOLIDUS}"
\N{SOLIDUS}
>>> print "\N{BLACK SPADE SUIT}"
\N{BLACK SPADE SUIT}
>>>
Run Code Online (Sandbox Code Playgroud)

然而,我可以看到另一个提问者已经能够成功地做到这一点.

怎么了?

python unicode unicode-string python-2.7 python-unicode

5
推荐指数
1
解决办法
4955
查看次数

概率。关于希伯来语编码

我有一个希伯来语文本"×??¸×¨?´×™×??°×?ו?¹×?",我想将它转换为可读的 unicode 希伯来语字符。

我试过这个代码:

const string Str = "×??¸×¨?´×™×??°×?ו?¹×?";

Encoding enc1 = Encoding.Default;
Encoding enc2 = Encoding.Unicode;

byte[] bytes = enc1.GetBytes(Str);

string hebrewString = enc2.GetString(bytes);

label1.Text = hebrewString;
Run Code Online (Sandbox Code Playgroud)

但它没有成功。请帮忙。

更新 文本来自html源代码

Version:1.0
StartHTML:000000210
EndHTML:000006218
StartFragment:000001595
EndFragment:000006126
StartSelection:000001595
EndSelection:000006126
SourceURL:file:///C:/ProgramData/Babylon/LocalUI/wnd.html
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3c.org/TR/1999/REC-    html401-19991224/loose.dtd">

<HTML 
xmlns="http://www.w3.org/1999/xhtml"><HEAD><TITLE>CLient build #1.2</TITLE><LINK 
rel=stylesheet type=text/css href="img/frame.css?ver=41"><LINK rel=stylesheet 
type=text/css href="img/baby.css?ver=41"><LINK rel=stylesheet type=text/css 
href="img/word.css?ver=41"><LINK rel=stylesheet type=text/css 
href="img/text.css?ver=41">
<SCRIPT type=text/javascript src="js/moudles.js?ver=100"></SCRIPT>

<SCRIPT type=text/javascript src="js/extrnl.js?ver=100"></SCRIPT>

<SCRIPT type=text/javascript src="js/frame.js?ver=100"></SCRIPT>

<SCRIPT type=text/javascript src="js/word.js?ver=100"></SCRIPT>

<SCRIPT type=text/javascript …
Run Code Online (Sandbox Code Playgroud)

c# character-encoding unicode-string hebrew

5
推荐指数
1
解决办法
1636
查看次数

在Delphi中将UnicodeString附加到WideString

我很好奇Delphi 2010中这段代码会发生什么:

function foo: WideString;
var 
   myUnicodeString: UnicodeString; 
begin
  for i:=1 to 1000 do
  begin
    myUnicodeString := ... something ...;

    result := result + myUnicodeString;  // This is where I'm interested
  end;
end;
Run Code Online (Sandbox Code Playgroud)

涉及多少字符串转换,是否有任何特别糟糕的性能?

我知道该函数应该只返回一个UnicodeString,但我在VCL流代码中看到了这种反模式,并希望了解该过程.

delphi unicode-string widestring

5
推荐指数
1
解决办法
1383
查看次数

如何获取包含 Unicode 的电子邮件地址?

我正在尝试获取其中包含 unicode 的电子邮件地址。就像\xd0\xb5\xd0\xba\xd0\xb7\xd0\xb0\xd0\xbc\xd0\xbf\xd0\xbb@example.com。我尝试过中文网站(http://www.sina.com.cn/)、gmail.com,甚至我自己的namecheap 托管网站。它们都只要求 ASCII 字符。我正在尝试测试和更新库,但想测试其中包含 unicode 的真实电子邮件地址。

\n

email unicode unicode-string

5
推荐指数
1
解决办法
2293
查看次数

是否可以在 cpanm 文件中要求 git 存储库?

我正在尝试使用 cpanfile 和 cpanm 来安装大量模块。其中一个模块 Unicode::String 在 CPAN 上有一个错误,作者仅在 Github 上修复了该错误。(https://github.com/msouth/Unicode-String

是否可以将 Github 存储库列为 cpanfile 中的要求,并从那里而不是从 CPAN 安装 cpanm?如果是这样,这样做的正确语法是什么?

我发现的最接近的是 2013 年的一条线索,宫川说它将在未来的版本中推出,然后未来的版本很脆弱并且被搁置:

https://github.com/perl-carton/carton/issues/132 (这里讨论 carton,但由于它们都使用 cpanfile,因此语法应该相同。)

perl github unicode-string cpanm

5
推荐指数
1
解决办法
565
查看次数

(德语)下 ß (U+00DF) 和上 ? 之间的折写转换 (U+1E9E)?

根据维基百科,2017 年,使用大写字母\xe1\xba\x9e(Unicode U+1E9E) 被正式采用——至少作为一种选择——实际上可能是德语中全大写单词的子集:

\n

同年 6 月,德国正字法委员会正式通过了一项规则,\xe2\x9f\xa8\xe1\xba\x9e\xe2\x9f\xa9 将成为 \xe2\x9f\xa8\xc3\x9f 大写的选项\xe2\x9f\xa9 除了之前的大写形式 \xe2\x9f\xa8SS\xe2\x9f\xa9 之外(即变体 STRASSE 和 STRA\xe1\xba\x9eE 将被视为同等有效)。2

\n

似乎对德语的这一补充将大大简化字符串之间的大小写比较(所谓的“大小写折叠”或“折叠大小写”比较)。注意,我开始这个询问是为了理解 Raku(又名 Perl6)的实现,但实际上这个问题似乎可以推广到其他编程语言。这是 Raku 的默认实现 - 从rfdr_Regeln_2017.pdf中的 13 个单词开始,这些单词已小写(通过 Raku 的.lc函数):

\n
~$ cat TO_\xe1\xba\x9e_OR_NOT_TO_\xe1\xba\x9e.txt\nma\xc3\x9f stra\xc3\x9fe grie\xc3\x9f spie\xc3\x9f gro\xc3\x9f gr\xc3\xbc\xc3\x9fen au\xc3\x9fen au\xc3\x9fer drau\xc3\x9fen strau\xc3\x9f bei\xc3\x9fen flei\xc3\x9f hei\xc3\x9fen\n~$ raku -ne \'.words>>.match(/^ <:Ll>+ $/).say;\' TO_\xe1\xba\x9e_OR_NOT_TO_\xe1\xba\x9e.txt\n(\xef\xbd\xa2ma\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2stra\xc3\x9fe\xef\xbd\xa3 \xef\xbd\xa2grie\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2spie\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2gro\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2gr\xc3\xbc\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2au\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2au\xc3\x9fer\xef\xbd\xa3 \xef\xbd\xa2drau\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2strau\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2bei\xc3\x9fen\xef\xbd\xa3 \xef\xbd\xa2flei\xc3\x9f\xef\xbd\xa3 \xef\xbd\xa2hei\xc3\x9fen\xef\xbd\xa3)\n~$ raku -ne \'.uc.say;\' TO_\xe1\xba\x9e_OR_NOT_TO_\xe1\xba\x9e.txt\nMASS STRASSE GRIESS …
Run Code Online (Sandbox Code Playgroud)

string unicode unicode-string string-comparison raku

5
推荐指数
1
解决办法
307
查看次数