SyntaxError: 在前缀映射中找不到前缀“a”

Question

SyntaxError: 在前缀映射中找不到前缀“a”

Mil*_*ano 9 python elementtree python-2.7

我正在尝试创建一个计算pptx文档中字数的函数。问题是我不知道如何只找到这种标签：

<a:t>Some Text</a:t>

当我尝试：print xmlTree.findall('.//a:t')，它返回

SyntaxError: 在前缀映射中找不到前缀“a”

你知道怎么做才能让它发挥作用吗？

这是函数：

def get_pptx_word_count(filename):
    import xml.etree.ElementTree as ET
    import zipfile
    z = zipfile.ZipFile(filename)
    i=0
    wordcount = 0
    while True:
        i+=1
        slidename = 'slide{}.xml'.format(i)
        try:
            slide = z.read("ppt/slides/{}".format(slidename))
        except KeyError:
            break
        xmlTree = ET.fromstring(slide)
        for elem in xmlTree.iter(): 
            if elem.tag=='a:t':
                #text = elem.getText
                #num = len(text.split(' '))
                #wordcount+=num

Run Code Online (Sandbox Code Playgroud)

Answer 1

hir*_*lau 13

ElementTree内部指定命名空间的方法是：

{namespace}element

Run Code Online (Sandbox Code Playgroud)

因此，您应该将查询更改为：

print xmlTree.findall('.//{a}t')

Run Code Online (Sandbox Code Playgroud)

编辑：

正如 @mxjn 指出的，如果 a 是前缀而不是 URI，则需要插入 URI 而不是 a：

 print xmlTree.findall('.//{http://tempuri.org/name_space_of_a}t')

Run Code Online (Sandbox Code Playgroud)

或者您可以提供前缀映射：

 prefix_map = {"a": "http://tempuri.org/name_space_of_a"}
 print xmlTree.findall('.//a:t', prefix_map)

Run Code Online (Sandbox Code Playgroud)

Answer 2

dsh*_*dsh -3

您需要讲述ElementTree您的 XML 命名空间。

参考：

官方文档（Python 2.7）： 19.7.1.6。使用命名空间解析 XML
StackOverflow 上的现有答案： Parsing XML with namespace in Python via 'ElementTree'
ElementTree 作者的文章： ElementTree：使用命名空间和限定名称

仅链接答案并不是特别有帮助。解决此问题的任何相关信息都应包含在答案本身中。 (4认同)

归档时间：	8 年，11 月前
查看次数：	12817 次
最近记录：	5 年，9 月前