小编use*_*206的帖子

使用BeautifulSoup迭代XML以提取特定标记并存储在变量中

我对编程很新,并且一直试图为此找到解决方案,但我能找到的只是点点滴滴而没有真正的运气将它们放在一起.

我想用BeautifulSoup4python刮一些xml并存储在变量的特定标记之间的文本值.这些数据来自医学生培训计划,现在所需的一切都必须手动找到.所以我试图通过抓取程序来提高效率.

比方说,我正在研究这种类型的测试数据来试验:

<AllergyList>
<Allergy>
    <Deleted>n</Deleted>
    <Status>
        <Active/>
    </Status>
    <ExternalID/>
    <Patient>
        <ExternalID/>
        <FirstName>Testcase</FirstName>
        <LastName>casetest</LastName>
    </Patient>
    <Allergen>
        <Name>Flagyl (metronidazole)</Name>
        <Drug>
           <NDCID>00025182151,00025182131,00025182150</NDCID>
        </Drug>
    </Allergen>
    <Reaction>difficulty breathing</Reaction>
    <OnsetDate>02/02/2013</OnsetDate>
 </Allergy>
<Allergy>
    <Deleted>n</Deleted>
    <Status>
        <Active/>
    </Status>
    <ExternalID/>
    <Patient>
        <ExternalID/>
        <FirstName>Testcase</FirstName>
        <LastName>casetest</LastName>
    </Patient>
    <Allergen>
        <Name>Bactrim (sulfamethoxazole-trimethoprim)</Name>
        <Drug>
            <NDCID>13310014501,49999023220</NDCID>
        </Drug>
    </Allergen>
    <Reaction>swelling</Reaction>
    <OnsetDate>05/03/2002</OnsetDate>
  </Allergy>
  <Number>2</Number>
</AllergyList>
Run Code Online (Sandbox Code Playgroud)

我一直试图<Name>从多个<Allergen>标签之间拉出标签以及从标签<Onsetdate><Reaction>标签之间的相应数据,同时将拉结果存储到各自的变量中.

因此,例如,我会想拉Flagyl (metronidazole),difficulty breathing,02/02/2013,然后Bactrim (sulfamethoxazole-trimethoprim),swelling,05/03/2002,等,同时将它们放置在不同的变量,我可以在以后使用. …

python xml variables loops beautifulsoup

5
推荐指数
1
解决办法
2766
查看次数

标签 统计

beautifulsoup ×1

loops ×1

python ×1

variables ×1

xml ×1