相关疑难解决方法(0)

普通的python字符串使用什么编码?

我知道django在整个框架中使用unicode字符串而不是普通的python字符串.普通的python字符串使用什么编码?为什么他们不使用unicode?

python encoding

14
推荐指数
4
解决办法
1万
查看次数

Python 2.7.6将单个"高"unicode代码点拆分为两个

作为MySQL在遇到"高"(序数> = 2 ^ 16)代码点时截断unicode字符串的一种解决方法,我一直在使用一个逐步执行字符串的小Python方法(字符串是序列,记住),ord()在字符上,并通过替换其他内容或直接删除代码点来取代截断.这已经在许多使用Python 2.7.3的机器上运行(Ubuntu 12.04 LTS,一些Centos 6,混合32位和64位CPU,到目前为止还不重要).

我注意到在Python 2.7.6安装上,这会中断.Ascii字符和"低"代码点(序数<2 ^ 16)表现如前.但是高代码点(> = 2 ^ 16)表现得非常奇怪.Python2.7.6似乎将它们视为两个代码点.这是一个基础知识的测试用例:

### "good" machine, Python2.7.3
$ uname -a && echo $LANG
Linux *** 3.2.0-60-virtual #91-Ubuntu SMP Wed Feb 19 04:13:28 UTC 2014 x86_64 x86_64 x86_64 GNU/Linux
en_US.UTF-8
$ python2.7
Python 2.7.3 (default, Feb 27 2014, 19:58:35) 
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> utest = u'a\u0395\U0001f30e'    # three chars: ascii, "low" codepoint, "high" codepoint
>>> …
Run Code Online (Sandbox Code Playgroud)

python unicode python-2.7

5
推荐指数
1
解决办法
589
查看次数

标签 统计

python ×2

encoding ×1

python-2.7 ×1

unicode ×1