使用Python解析XML文件并在每个列表元素中获得字母"u"

Question

我有一个XML文件,其中包含以下元素:

<RMS>[14.470156174, 14.470156174, 14.485567944, 14.496014765]</RMS>

我想得到一个包含所有元素的列表

所以我用以下代码尝试了一些正则表达式:

      string = dom.getElementsByTagName('RMS')[0].toxml()
      string2 = re.findall("[\-]*[0-9]*\.[0-9]*", string)

现在,当我想打印列表时,它看起来像这样:

      [u'14.470156174', u'14.470156174', u'14.485567944', u'14.496014765']

'你'发生了什么事？
有什么想法如何解决这个问题？谢谢你的帮助.

Answer 1

以a开头的字符串u是unicode字符串文字.由于XML包含unicode数据,因此XML解析器以正确的类型返回数据,这是python unicode()类型.

你不需要删除它们,你没有问题.您可能想要阅读Python Unicode HOWTO中的Unicode和Python,但这里没有问题.

由于这些是数字,您可以将unicode值直接转换为float实例.