标签: unicode-string

为什么"\ 400"不是编译时错误?

在0和255之间的字符值可以通过从八进制文字来表示"\000""\377".

那么不"\400"应该是编译时错误?Eclipse没有抱怨,但是......这里发生了什么?

java string unicode unicode-string string-literals

3
推荐指数
2
解决办法
129
查看次数

将两个字节组合到WideChar

是否有可能两者结合BytesWideChar,如果是,那么如何?
例如,二进制中的字母"ē"是00010011= 1900000001= 1,或者275在一起.

var
  WChar: WideChar;
begin
  WChar := WideChar(275); // Result is "?"
Run Code Online (Sandbox Code Playgroud)


var
  B1, B2: Byte;
  WChar: WideChar;
begin
  B1 := 19;
  B2 := 1;
  WChar := CombineBytesToWideChar(B1, B2); // ???
Run Code Online (Sandbox Code Playgroud)

如何WideChar从Delphi中的两个字节获取?

delphi delphi-7 unicode-string multibyte-functions widechar

3
推荐指数
1
解决办法
791
查看次数

在c#中将unicode字符串写入csv

我使用以下代码从 unicode 字符串创建 csv 文件:

context.Response.ContentType = "text/csv";
context.Response.ContentEncoding = System.Text.Encoding.Utf8;        
context.Response.AddHeader("Content-Disposition", "attachment; filename=" + fundName + ".csv");
context.Response.BinaryWrite(System.Text.Encoding.Unicode.GetPreamble());                

String output ="";        
output += "Name, callNumber" + "\n";
String output ="???,34343555" + "\n";     
context.Response.Write(output);
Run Code Online (Sandbox Code Playgroud)

问题是未正确显示“???”的 unicode 字符。

感谢您的任何指导。问候阿里

c# csv unicode-string

3
推荐指数
1
解决办法
1万
查看次数

获取波斯字符初始内侧最终 unicode

我想将 Unicode 波斯字符放在一个单词中。

例如转换“????” 到 '?' '?'?'?

我发现ArabicLigaturizer可以完成我在阿拉伯语中的要求。

有没有一种简单的方法可以在 .net 中为波斯语做到这一点?

我用这个代码

    (System.Text.RegularExpressions.Regex.IsMatch(SearchText, @"\p{IsArabic}"))
 SearchText = (new iTextSharp.text.pdf.ArabicLigaturizer()).Process(SearchText);
Run Code Online (Sandbox Code Playgroud)

但仍然有些文件有问题。我认为这取决于 PdfWriter。

c# persian unicode-string

3
推荐指数
1
解决办法
2137
查看次数

使用 unicode 字符串对数组进行排序

我有一个包含 3 个名称的数组。

var patients = ["Kund Karlsson", "Test Vid behov", "Test Övrigt"]
Run Code Online (Sandbox Code Playgroud)

我需要按字母顺序对这些名称进行排序。这是它应该被订购的结果。

  1. 昆德卡尔松
  2. 测试视频行为
  3. 测试概览

我像这样对数组进行排序,patients.sort({ $0 < $1 })但我得到了错误的顺序。

  1. 昆德卡尔松
  2. 测试概览
  3. 测试视频行为

我认为这是由那个 unicode 字母引起的Ö

当字符串中有 unicode 字符时,有没有办法处理排序?

谢谢你。

arrays sorting unicode unicode-string swift

3
推荐指数
1
解决办法
1485
查看次数

AnsiString是Embarcadero C++ Builder中类型字符串的默认值?

我继承了一个旧的Borland C++ Builder应用程序,现在我必须迁移到一个新的开发工具.建议的方法是使用Embarcadero C++ Builder,从我最初的测试看,它似乎是一个相当平滑的过渡.

但我有一个问题,我希望有一个简单的解决方案:

该应用程序解析大量的文本文件.这些文件都是基于ANSI的,并且永远不会改变,因此它是ANSI输入和ANSI输出.我string遇到的主要问题是,使用Embarcadero C++,类型现在是一个UnicodeString而不是AnsiString(就像在Borland C++ Builder中一样).

在此应用程序中使用Unicode不是一个选项 - 它使用的文件是ANSI格式的.修改要使用的代码AnsiString(和类似的代码)是可行的,但我不愿意,因为它使用了很多TStringList(和类似的)构造.

所以我的问题是:是否有一个设置或编译器选项或者我可以用来告诉Embarcadero System.AnsiString用作定义string而不是System.UnicodeString

这可能是一个长镜头,但是RAD Studio XE(我借用它来做一些测试的旧版本)文档说" 默认情况下,类型string现在是一个Unicode字符串",这意味着这可以是改变.然而,这在当前版本(XE8)的文档中被重新描述,所以......

c++ c++builder unicode-string ansistring

3
推荐指数
1
解决办法
5182
查看次数

用字符替换 unicode 字符(Javascript)

以下面的字符串为例:

&#8220;A profile of Mr. T, the A Team&#8217;s most well known member.&#8221;

如何使用 javascript 替换 unicode 字符编码并将其转换为以下内容:

"A profile of Mr. T, the A Team's most well known member."

javascript unicode unicode-string

3
推荐指数
1
解决办法
4294
查看次数

Java 将字符串转换为 Unicode 字符。“U+1F600”=

请注意,这个问题不是重复的。

我有一个这样的字符串:

// My String
String myString = "U+1F600";
// A method to convert the String to a real character
String unicodeCharacter = convertStringToUnicode(myString);
// Then this should print: 
System.out.println(unicodeCharacter);
Run Code Online (Sandbox Code Playgroud)

如何将此字符串转换为 unicode 字符?然后我想在一个TextView.

java string unicode android unicode-string

3
推荐指数
1
解决办法
2289
查看次数

Python 3.6 - 无法在字符串中转换 Unicode

我正在使用 Python 3.6 进行一些抓取工作,并按照以下格式检索字符串中的一些 URL:

someURL = 'http:\u002F\u002Fsomewebsite.com\u002Fsomefile.jpg'
Run Code Online (Sandbox Code Playgroud)

我一直在尝试转换这些字符串中的 Unicode 反斜杠 (\u002F) 以使用 URL(使用正则表达式方法、字符串上的 encode() 等),但无济于事。该字符串仍保留 Unicode 反斜杠,例如,如果我将其传递给 Requests 的 get(),则会收到以下错误消息:

InvalidURL: Failed to parse: http:\u002F\u002Fsomewebsite.com\u002Fsomefile.jpg"
Run Code Online (Sandbox Code Playgroud)

我在这个论坛和其他人中搜索了解决方案,但似乎无法解决它。我相信这很简单......

unicode-string python-3.x

3
推荐指数
1
解决办法
1340
查看次数

如何使用 fribidi 重新排序双向文本

我有一个组合的 English-ASCII/Arabic-Unicode 字符串,如:

???
abc
??
Run Code Online (Sandbox Code Playgroud)

3 个 Unicode 阿拉伯字符 + 空格 + 3 个 ASCII 英文字符 + 空格 + 2 个 Unicode 阿拉伯字符

UTF8:"\xD9\x85\xD8\xAA\xD9\x86\x20\x31\x32\x33\x20\xD9\x8C\xD8\xA9"

UTF16: "\xFEE3\xFE98\xFEE3\x20\x31\x32\x33\x20\xFBFE\xFB8F"

为了以上述联合形式显示文本,我的嵌入式设备 API 以相反的顺序接受 Unicode 阿拉伯语表示形式 B。因此,我需要将此字符串重新排序为以下表单:

重新排序的 UTF16:“\xFB8F\xFBFE\x20\x31\x32\x33\x20\xFEE3\xFE98\xFEE3”

并将其转换为 UTF8 Presentation Form B:

UTF8_FormB:"\xef\xae\x8f\xef\xaf\xbe\x20\x31\x32\x33\x20\xef\xbb\xa6\xef\xba\x98\xef\xbb\xa3"

我的问题是关于重新排序的重新排序步骤

UTF16: "\xFEE3\xFE98\xFEE3\x20\x31\x32\x33\x20\xFBFE\xFB8F"

重新排序的 UTF16:“\xFB8F\xFBFE\x20\x31\x32\x33\x20\xFEE3\xFE98\xFEE3”

我想我需要使用弗里比迪来做到这一点。这是我如何使用 Fribidi:

uint32_t                utf16Str[256]       = { 0};
uint32_t                reorderedStr[256]   = { 0};
uint16_t                rawLen              = 0;
uint16_t                utf16Len            = 0;
FriBidiCharType         pbase_dir           = FRIBIDI_TYPE_ON;
fribidi_boolean         stat;

    stat =  fribidi_log2vis(
    /* input */
    utf16Str,//UTF16: …
Run Code Online (Sandbox Code Playgroud)

c unicode freetype unicode-string harfbuzz

3
推荐指数
1
解决办法
275
查看次数