标签: unicode-string

是否有正确处理Unicode的STL字符串类?

我知道所有关于std :: string和std :: wstring但他们似乎并没有完全注意UTF-8和UTF-16的扩展字符编码(至少在Windows上).也不支持UTF-32.

那么有谁知道提供完整的UTF-8,UTF-16和UTF-32支持的跨平台直接替换类?

c++ unicode stl unicode-string

13
推荐指数
3
解决办法
7398
查看次数

PHP/MySQL中的PDO和UTF-8特殊字符?

我正在使用MySQL和PHP 5.3并尝试此代码.

$dbhost = 'localhost';
$dbuser = 'root';
$dbpass = '';
$con = mysql_connect("localhost", "root", "");
mysql_set_charset('utf8');
if (!$con)
{
  die('Could not connect: ' . mysql_error());
}

mysql_select_db("kdict", $con);
$sql = "SELECT * FROM `en-kh` where english='a'";
echo $sql;
$result = mysql_query($sql);

while($row = mysql_fetch_array($result))
{
  echo $row['english'] . " </br> " . $row['khmer'];
  echo "<br />";
}
?>
Run Code Online (Sandbox Code Playgroud)

=>我得到了很好的UTF-8渲染显示,做得很好.

但是现在我创建了一个类PDO,以便于扩展和更容易

 class crud {
     // code..
     public function conn()
     {
         isset($this->username);
         isset($this->password);
         if (!$this->db instanceof PDO)
         {
             $this->db = new …
Run Code Online (Sandbox Code Playgroud)

php pdo unicode-string

13
推荐指数
1
解决办法
3万
查看次数

UTF-16字符串终止符

UTF-16字符串的字符串终止符序列是什么?

编辑:

让我重新解释一下这个问题,试图澄清一下.wcslen()工作电话怎么样?

c string unicode utf-16 unicode-string

12
推荐指数
2
解决办法
7617
查看次数

将hash.digest()转换为unicode

import hashlib
string1 = u'test'
hashstring = hashlib.md5()
hashstring.update(string1)
string2 = hashstring.digest()

unicode(string2)

UnicodeDecodeError: 'ascii' codec can't decode byte 0x8f in position 1: ordinal
not in range(128)
Run Code Online (Sandbox Code Playgroud)

字符串HAS是unicode,它对我有用,可以这样做吗?使用python 2.7如果有帮助...

python unicode unicode-string

12
推荐指数
2
解决办法
4万
查看次数

iOS本地化:具有"\ uxxxx"形式的Unicode字符转义序列不起作用

我们在Localization.string文件中有键值对.

"spanish-key" = "Espa\u00f1ol";
Run Code Online (Sandbox Code Playgroud)

当我们获取并分配给标签时,app会将其显示为"Espau00f1ol".

不行.

self.label1.text= NSLocalizedString(@"spanish-key", nil);
Run Code Online (Sandbox Code Playgroud)

它工作 - 以所需的格式显示.

self.label1.text= @"Espa\u00f1ol";
Run Code Online (Sandbox Code Playgroud)

我们使用时可能会出现什么问题

NSLocalizedString(@"spanish-key", nil)?
Run Code Online (Sandbox Code Playgroud)

如果我们设置\ U而不是\ u,那么它可以工作.

 "spanish-key" = "Espa\U00f1ol";
Run Code Online (Sandbox Code Playgroud)

何时使用"\ Uxxxx"和"\ uxxxx"?

unicode-string localizable.strings ios

12
推荐指数
1
解决办法
5224
查看次数

包裹在pango的词用混杂的脚本

我有一个使用pango的文本框实现.如果我把一个以从右到左的脚本开头的字符串,后跟一个空格,然后是从左到右的脚本中的单词,那么pango使用的自动翻译就会搞砸(使用PANGO_WRAP_WORD_CHAR).对于字符串العربيةENGLISH,我得到以下内容:

不好的词包装

如果我U+200F在空格后添加unicode字符,那么我得到预期的自动换行:

预期自动换行

另外,如果我用印地语替换上面的阿拉伯语脚本(从左到右,就像它旁边的英语​​一样),那么我仍然会遇到问题,所以它似乎不是严格的从左到右,对吧到左边的东西.在印地语的情况下,我放入一个hack,0x200E在空格后插入一个解决问题的空间.

这是pango中的一个错误吗?是否有我可以尝试的解决方案,足以解决问题而不打破其他情况?目前我正在使用基于字符串中前一个强定向字符的方向在每个空格中插入0x200E或插入0x200F,但我不确定是否存在某些字符串会导致问题.

更新:我能够使用gedit在Ubuntu 12.04上重现此问题(启用文本环绕并且启用两行设置时不执行拆分).我简单地输入Hello world一遍又一遍,直到它包裹好几次,然后替换的所有实例world????????,一切晕倒一行.

unicode text pango arabic unicode-string

12
推荐指数
1
解决办法
452
查看次数

如何在标准C++字符串中使用3字节和4字节Unicode字符?

在标准C++中,我们有charwchar_t存储字符.char可以存储0x000xFF之间的值.并且wchar_t可以在0x0000和之间存储值0xFFFF.std::string使用char,因此它只能存储1个字节的字符.std::wstring使用wchar_t,因此它可以存储最多2个字节宽度的字符.这就是我对C++中字符串的了解.如果到目前为止我说错了,请纠正我.

我在维基百科上阅读了UTF-8的文章,我了解到一些Unicode字符占用的空间最多为4个字节.例如,汉字有一个Unicode代码点0x24B62,它占用内存中的3字节空间.

是否有一个STL字符串容器来处理这些字符?我正在寻找类似的东西std::string32.此外,我们有main()ASCII入口点,wmain()对于具有16位字符支持的入口点; 我们使用3和4字节Unicode支持的代码的入口点是什么?

你能加一个小例子吗?

(我的操作系统:Windows 7 x64)

c++ string stl stdstring unicode-string

11
推荐指数
1
解决办法
5717
查看次数

正则表达式(类似Twitter)标签,允许非ASCII字符

我想要一个正则表达式来匹配像twitter中那样的简单主题标签(例如#someword).我希望它也能识别非标准字符(如西班牙语,希伯来语或中文字符).

这是我最初的正则表达式:(^|\s|\b)(#(\w+))\b
- >但它不识别非标准字符.
然后,我尝试使用XRegExp.js,但是运行得太慢了.

有关如何做的任何建议?

javascript regex twitter unicode-string hashtag

11
推荐指数
1
解决办法
8364
查看次数

将\ u转义的Unicode字符串转换为ASCII

阅读所有关于后iconvEncoding,我仍然感到困惑.

我正在抓取网页的来源我有一个如下所示的字符串:( 'pretty\u003D\u003Ebig'在R控制台中显示'pretty\\\u003D\\\u003Ebig').我想将其转换为ASCII字符串,应该是'pretty=>big'.

更简单,如果我设置

x <- 'pretty\\u003D\\u003Ebig'
Run Code Online (Sandbox Code Playgroud)

如何进行转换x以获得收益pretty=>big

有什么建议?

unicode text-processing r unicode-string iconv

11
推荐指数
2
解决办法
1万
查看次数

以Unicode字符获取"实际"字符串长度

给定像" ?"(\xe2\x9c\xae)之类的字符,例如,可以是其他像" ?"," ?"或" ?")我想找到字符在屏幕上打印时所占用的"实际"长度

例如

len("?")
len("\xe2\x9c\xae")
Run Code Online (Sandbox Code Playgroud)

两者都返回3,但应该是1

python unicode-string string-length python-2.7

11
推荐指数
1
解决办法
3059
查看次数