我需要的是获取相应标签的文本并将其保存到数据库中.由于xml文件很大(4.5GB),我使用的是sax.我使用characters方法获取文本并将其放在字典中.但是当我在endElement方法中打印文本时,我得到一个新行而不是文本.
这是我的代码:
def characters(self,content):
text = unescape(content))
self.map[self.tag]=text
def startElement(self, name, attrs):
self.tag = name
def endElement (self, name)
if (name=="sometag")
print self.map[name]
Run Code Online (Sandbox Code Playgroud)
提前致谢.
标签中的文本由SAX处理器分块.characters
可能被多次调用.
你需要做一些事情:
def startElement(self, name, attrs):
self.map[name] = ''
self.tag = name
def characters(self, content):
self.map[self.tag] += content
def endElement(self, name):
print self.map[name]
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
4196 次 |
最近记录: |