相关疑难解决方法(0)

Unicode错误序数不在范围内

我的unicode奇怪的错误.我正在处理unicode很好,但是当我今天早上运行它时,一个项目你''u201d'给了我错误并给了我

UnicodeError: ASCII encoding error: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)

我查了代码,显然是它的utf-32但是当我尝试在解释器中解码时:

c = u'\u201d'
c.decode('utf-32', 'replace')
Run Code Online (Sandbox Code Playgroud)

或者它的任何其他操作,它只是没有在任何编解码器中识别它但我发现它是"正确的双引号"

我明白了:

Traceback (most recent call last):
File "<pyshell#154>", line 1, in <module>
    c.decode('utf-32')
  File "C:\Python27\lib\encodings\utf_32.py", line 11, in decode
    return codecs.utf_32_decode(input, errors, True)
UnicodeEncodeError: 'ascii' codec can't encode character u'\u201d' in position 0: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)

python unicode

5
推荐指数
1
解决办法
1万
查看次数

Python字符串解码问题

我试图解析一个包含一些数据的CSV文件,主要是数字但有一些字符串 - 我不知道它们的编码,但我知道它们是希伯来语.

最终我需要知道编码,这样我就可以对字符串进行unicode,打印它们,然后将它们放入数据库中.

我尝试使用Chardet,它声称字符串是Windows-1255(cp1255),但试图print someString.decode('cp1255')产生臭名昭着的错误:

UnicodeEncodeError: 'ascii' codec can't encode characters in position 1-4: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)

我尝试了所有其他编码,但无济于事.此外,该文件绝对有效,因为我可以在Excel中打开CSV,我看到正确的数据.

知道我怎么能正确解码这些字符串?


编辑:这是一个例子.其中一个字符串看起来像这样(希伯来字母表的前五个字母):

print repr(sampleString)
#prints:
'\xe0\xe1\xe2\xe3\xe4'
Run Code Online (Sandbox Code Playgroud)

(使用Python 2.6.2)

python string unicode character-encoding

3
推荐指数
1
解决办法
2万
查看次数

标签 统计

python ×2

unicode ×2

character-encoding ×1

string ×1