这肯定是一个简单的,但它真的很烦我.
我有一个脚本可以读入网页并使用Beautiful Soup来解析它.从汤中我提取所有链接,因为我的最终目标是打印出link.contents.
我正在解析的所有文本都是ASCII.我知道Python将字符串视为unicode,我确信这非常方便,只是在我的小脚本中没用.
每次我打印出一个包含'String'的变量时,我都会[u'String']打印到屏幕上.是否有一种简单的方法可以将其恢复为ascii,还是应该编写正则表达式来删除它?
当我尝试在Windows控制台中打印Unicode字符串时,出现UnicodeEncodeError: 'charmap' codec can't encode character ....错误.我认为这是因为Windows控制台不接受仅Unicode字符.最好的方法是什么??在这种情况下,有什么方法可以让Python自动打印而不是失败?
编辑: 我正在使用Python 2.5.
注意: @ LasseV.Karlsen回答带有复选标记有点过时(从2008年开始).请谨慎使用下面的解决方案/答案/建议!!
截至今天(2016年1月6日),@ JFSebastian答案更为相关.