相关疑难解决方法(0)

如何使python解释器正确处理字符串操作中的非ASCII字符？

我有一个看起来像这样的字符串:

6Â 918Â 417Â 712

Run Code Online (Sandbox Code Playgroud)

修剪这个字符串的明确方法(据我理解Python)只是说字符串在一个名为的变量中s,我们得到:

s.replace('Â ', '')

Run Code Online (Sandbox Code Playgroud)

这应该够了吧.但当然它抱怨'\xc2'文件blabla.py 中的非ASCII字符未编码.

我永远不会理解如何在不同的编码之间切换.

这是代码,它实际上与上面相同,但现在它在上下文中.该文件在记事本中保存为UTF-8,并具有以下标头:

#!/usr/bin/python2.4
# -*- coding: utf-8 -*-

Run Code Online (Sandbox Code Playgroud)

代码:

f = urllib.urlopen(url)

soup = BeautifulSoup(f)

s = soup.find('div', {'id':'main_count'})

#making a print 's' here goes well. it shows 6Â 918Â 417Â 712

s.replace('Â ','')

save_main_count(s)

Run Code Online (Sandbox Code Playgroud)

它不过是s.replace......

python unicode

ade*_*ard

2013 11-20

100
推荐指数

6
解决办法

17万
查看次数

标签统计

python ×1

unicode ×1

如何使python解释器正确处理字符串操作中的非ASCII字符？

标签 统计

标签统计