小编use*_*004的帖子

解析非标准XML(CDATA标记)

当我想使用BeautifulSoup库在Python中解析XML文档时,我遇到了一些问题.我要解析的XML文档:

<item>
<title><![CDATA[Title Sample]]></title>
<link /><![CDATA[http://banhada.kr/?cateCode=09&viewCode=S0941580]]>
<time_start>2011-10-10 09:00:00</time_start>
<time_end>2011-10-17 09:00:00</time_end>
<price_original>35000</price_original>
<price_now>20000</price_now>
</item>

Run Code Online (Sandbox Code Playgroud)

如上所示,标签有点奇怪.在我看来,(标签)不是一个立场XML形式,对吗？我该如何解析这种可怕的形式？

python xml beautifulsoup

use*_*004

2017 05-26

5
推荐指数

2
解决办法

2万
查看次数