例如:"½"或ASCII DEC 189.当我从文本文件中读取字节时,byte []包含有效值,在本例中为189.
转换为Unicode会导致Unicode替换字符65533.
UnicodeEncoding.Unicode.GetString(b)中;
转换为ASCII结果为63或"?"
ASCIIEncoding.ASCII.GetString(b)中;
如果这不可能,处理这些数据的最佳方法是什么?我希望能够执行像Replace()这样的字符串函数.
有谁知道为什么设计决定将“[”和“]”或“{”和“}”ASCII键码分开两个而不是一个数字?强迫症被触发。
public static void main(String[] args)
{
int i=153;
int j=63;
System.out.println((char)i);
System.out.println((char)j);
}
OUTPUT:-
?
?
Run Code Online (Sandbox Code Playgroud)
我有一些想法为什么这个奇怪的输出..但任何人都可以给我一些想法,以便我也可以打印扩展的ASCII ...
我已经尝试打印扩展ASCII字符:
http://www.theasciicode.com.ar/
但所有这些符号都在白色背景上打印为问题字符?.
我使用以下周期来打印这些符号:
for (i = 0; i <= 30; i++)
printf("%c", 201);
Run Code Online (Sandbox Code Playgroud)
问题:有没有办法打印这些扩展ASCII字符?或者也许这些角色有特殊的图书馆?
OS Linux Ubuntu 13.04,Code :: Blocks 12.11 IDE.
我有一些UTF-8内容,包括多字节智能引号字符.我发现这段代码很容易将这些字符转换成ASCII直引号(ASCII码34):
$content = iconv("UTF-8", "ASCII//TRANSLIT", $content);
Run Code Online (Sandbox Code Playgroud)
要么
$content = iconv("UTF-8", "ISO-8859-1//TRANSLIT", $content);
Run Code Online (Sandbox Code Playgroud)
但是,我宁愿将它们转换为扩展的ASCII智能引号(拉丁语1编码中的ASCII代码147和148).有谁知道如何做到这一点?
如何将扩展ASCII字符打印到控制台.例如,如果我使用以下内容
puts 57.chr
Run Code Online (Sandbox Code Playgroud)
它会在控制台上打印"9".如果我要使用
puts 219.chr
Run Code Online (Sandbox Code Playgroud)
它只会显示"?".它对所有从128到254的扩展ASCII代码执行此操作.是否有一种方法可以显示正确的字符而不是"?".
问题:我有两个来自外部系统的固定宽度字符串.第一个包含基本字符(如az),第二个(MAY)包含要附加到第一个字符串以创建实际字符的变音符号.
string asciibase = "Dutch has funny chars: a,e,u";
string diacrits = " ' \" \"";
//no clue what to do
string result = "Dutch has funny chars: á,ë,ü";
Run Code Online (Sandbox Code Playgroud)
我可以写一个大规模的搜索并替换所有字符+不同的变音符号,但希望更优雅的东西.
有人知道如何解决这个问题吗?尝试计算小数值,使用string.Normalize(c#),但没有结果.谷歌也没有真正想出办法.
ASCII和扩展ASCII固有的困难是什么以及Unicode如何克服这些困难?
有人可以解释一下unicode的兼容性吗?
什么与Unicode相关的术语如平面,基本多语言平面(BMP),基本多语言平面(SMP),补充表意平面(SIP),补充特殊平面(SSP)和私人使用平面(PUP)意味着什么.
我发现所有这些话都很混乱
我如何在Linux中打印这些字符?
│(ascii 179)
├(ascii 195)
└(ascii 192)
─(ascii 196)
我找不到任何适用于echo -e"\ 0xxx"的八进制值,任何想法?
我正在编写一个.NET正则表达式,该表达式需要匹配除控制字符之外的所有ASCII和扩展ASCII字符。
为此,我查阅了ASCII表,似乎所有这些字符的ASCII编码为x20到xFF。
所以我想
[\ x20- \ xFF]
应该能够匹配我需要的所有字符。但是,实际上,某些字符可以匹配,而另一些则不能。例如,如果您使用在线工具http://regexhero.net/tester/进行测试,或者编写了一个简单的C#程序,您会发现可以匹配某些字符,例如“ç”(xE7),而某些字符则可以匹配。因为“œ”(x9C)不能。
有谁知道为什么我的正则表达式不起作用?
谢谢,