使用python从.txt文件中提取数据

Ali*_*uff 1 python xml text extract

我有很多很多.xml文件,我需要从中提取一些坐标.直接从.xml文件中提取数据似乎非常非常复杂 - 所以我正在将.xml文件保存为.txt文件并以这种方式提取数据.但是,当我打开.txt文件时,我的数据全部聚集在大约6行上.到目前为止我找到的所有脚本通过读取每行的第一个单词来选择数据..但显然不会为我工作!我需要在这些评论之间提取数字:

<gml:lowerCorner>137796 483752</gml:lowerCorner> <gml:upperCorner>138178 484222</gml:upperCorner>
Run Code Online (Sandbox Code Playgroud)

在文本文件中,它们都组合在一起!有谁知道如何提取这些数据?谢谢!

Eli*_*sky 15

这绝对是错误的做法.别管它并改善你的方式:-)

说真的,如果文件是XML,那么只需使用XML解析器来读取它.学习如何用Python做这件事并不难,将来会让你的生活更轻松,将来也更容易,当你发现自己面临更复杂的解析需求时,你就不必重新学习它.

看看xml.etree.ElementTree.ElementTree.这是一些示例代码:

>>> from xml.etree.ElementTree import ElementTree
>>> tree = ElementTree()
>>> tree.parse("your_xml_file.xml")
Run Code Online (Sandbox Code Playgroud)

现在只需阅读模块的文档,看看你可以做些什么tree.您会惊讶地发现以这种方式获取信息是多么简单.如果您有关于提取数据的具体问题,我建议您打开另一个问题,在该问题中指定您必须解析的XML文件的格式,以及您必须从中获取的数据.我确信你会在几分钟内向你建议工作代码.

  • +1表示:*严重的是,如果文件是XML,那么只需使用XML解析器来读取它.* (3认同)