小编use*_*314的帖子

编码给出''ascii'编解码器不能编码字符...序数不在范围内(128)"

我通过Django的RSS阅读器项目的工作在这里.

RSS提要将读取类似"OKLAHOMA CITY(AP) - James Harden let"的内容.RSS feed的编码读取encoding ="UTF-8",所以我相信我在下面的代码片段中将utf-8传递给markdown.em dash是它窒息的地方.

我得到Django错误"'ascii'编解码器不能编码位置109中的字符u'\ u2014':ordinal not in range(128)"这是一个UnicodeEncodeError.在传递的变量中,我看到"OKLAHOMA CITY(AP)\ u2014 James Harden".无效的代码行是:

content = content.encode(parsed_feed.encoding, "xmlcharrefreplace")
Run Code Online (Sandbox Code Playgroud)

我正在使用markdown 2.0,django 1.1和python 2.4.

我需要做的编码和解码的神奇序列是什么才能使其工作?


(回应普罗米修斯的要求.我同意格式化有帮助)

所以在视图中我在parsed_feed编码行上面添加了一个smart_unicode行...

content = smart_unicode(content, encoding='utf-8', strings_only=False, errors='strict')
content = content = content.encode(parsed_feed.encoding, "xmlcharrefreplace") 
Run Code Online (Sandbox Code Playgroud)

这把问题推到了我的models.py中

def save(self, force_insert=False, force_update=False): 
     if self.excerpt: 
         self.excerpt_html = markdown(self.excerpt) 
         # super save after this 
Run Code Online (Sandbox Code Playgroud)

如果我将保存方法更改为...

def save(self, force_insert=False, force_update=False): 
     if self.excerpt: 
         encoded_excerpt_html = (self.excerpt).encode('utf-8') 
         self.excerpt_html = markdown(encoded_excerpt_html)
Run Code Online (Sandbox Code Playgroud)

我得到错误"'ascii'编解码器无法解码位置141的字节0xe2:序号不在范围内(128)"因为现在它读取"\ xe2\x80\x94",其中em dash是

python django unicode character-encoding

14
推荐指数
2
解决办法
3万
查看次数

标签 统计

character-encoding ×1

django ×1

python ×1

unicode ×1