elj*_*bso 1 python regex xml parsing list
我有一个XML文件,其中包含以下元素:
<RMS>[14.470156174, 14.470156174, 14.485567944, 14.496014765]</RMS>
Run Code Online (Sandbox Code Playgroud)
我想得到一个包含所有元素的列表
所以我用以下代码尝试了一些正则表达式:
string = dom.getElementsByTagName('RMS')[0].toxml()
string2 = re.findall("[\-]*[0-9]*\.[0-9]*", string)
Run Code Online (Sandbox Code Playgroud)
现在,当我想打印列表时,它看起来像这样:
[u'14.470156174', u'14.470156174', u'14.485567944', u'14.496014765']
Run Code Online (Sandbox Code Playgroud)
'你'发生了什么事?
有什么想法如何解决这个问题?谢谢你的帮助.
以a开头的字符串u是unicode字符串文字.由于XML包含unicode数据,因此XML解析器以正确的类型返回数据,这是python unicode()类型.
你不需要删除它们,你没有问题.您可能想要阅读Python Unicode HOWTO中的Unicode和Python,但这里没有问题.
由于这些是数字,您可以将unicode值直接转换为float实例.