我对编程很新,并且一直试图为此找到解决方案,但我能找到的只是点点滴滴而没有真正的运气将它们放在一起.
我想用BeautifulSoup4在python刮一些xml并存储在变量的特定标记之间的文本值.这些数据来自医学生培训计划,现在所需的一切都必须手动找到.所以我试图通过抓取程序来提高效率.
比方说,我正在研究这种类型的测试数据来试验:
<AllergyList>
<Allergy>
<Deleted>n</Deleted>
<Status>
<Active/>
</Status>
<ExternalID/>
<Patient>
<ExternalID/>
<FirstName>Testcase</FirstName>
<LastName>casetest</LastName>
</Patient>
<Allergen>
<Name>Flagyl (metronidazole)</Name>
<Drug>
<NDCID>00025182151,00025182131,00025182150</NDCID>
</Drug>
</Allergen>
<Reaction>difficulty breathing</Reaction>
<OnsetDate>02/02/2013</OnsetDate>
</Allergy>
<Allergy>
<Deleted>n</Deleted>
<Status>
<Active/>
</Status>
<ExternalID/>
<Patient>
<ExternalID/>
<FirstName>Testcase</FirstName>
<LastName>casetest</LastName>
</Patient>
<Allergen>
<Name>Bactrim (sulfamethoxazole-trimethoprim)</Name>
<Drug>
<NDCID>13310014501,49999023220</NDCID>
</Drug>
</Allergen>
<Reaction>swelling</Reaction>
<OnsetDate>05/03/2002</OnsetDate>
</Allergy>
<Number>2</Number>
</AllergyList>
Run Code Online (Sandbox Code Playgroud)
我一直试图<Name>从多个<Allergen>标签之间拉出标签以及从标签<Onsetdate>和<Reaction>标签之间的相应数据,同时将拉结果存储到各自的变量中.
因此,例如,我会想拉Flagyl (metronidazole),difficulty breathing,02/02/2013,然后Bactrim (sulfamethoxazole-trimethoprim),swelling,05/03/2002,等,同时将它们放置在不同的变量,我可以在以后使用. …