我一直在尝试使用 Pandas 和 xml.etree.ElementTree 将嵌套的 XML 文件转换为 Python 中的数据帧。
XML-看起来像这样:
<Hospital>
<HospitalClass name = "St. Mungo's Hospital for Magical Maladies">
<dataStorage id ="3" class="UnitVector">
<UnitVector name="numHospitalized">
<Data> 3; 5; 1; 2; 6; 9; 8 </Data>
</UnitVector>
</dataStorage>
<dataStorage id ="1" class="UnitVector">
<UnitVector name="numOperated">
<Data> 5; 0; 12; 8; 4; 5; 7</Data>
</UnitVector>
</dataStorage>
<dataStorage id = "2" class ="UnitVector">
<UnitVector name="antibioticsUsed">
<Data> 4.54; 5.71; nan; 7.12; 8.75; 2.99; 4.94</Data>
</UnitVector>
</dataStorage>
</HospitalClass>
</Hospital>
Run Code Online (Sandbox Code Playgroud)
我的主要问题是以分号分隔的这种格式提取数据。我已经查看了 stackoverflow 的所有内容,但没有找到任何类似的帖子。
使用
import pandas as …Run Code Online (Sandbox Code Playgroud)