我正在阅读和解析Amazon XML文件,而XML文件显示',当我尝试打印它时,我收到以下错误:
'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)
从我到目前为止在线阅读的内容来看,错误来自于XML文件是UTF-8,但Python希望将其作为ASCII编码字符处理.是否有一种简单的方法可以使错误消失并让我的程序在读取时打印XML?
我有一个强大的功能,我从XML文件中删除它,它包含一些HTML格式标记
(<b>, <i>, etc)
Run Code Online (Sandbox Code Playgroud)
有没有一种快速简便的方法从文本中删除所有这些标签?
我试过了
str = str.replace("<b>","")
Run Code Online (Sandbox Code Playgroud)
并将其多次应用于其他标签,但这不起作用