小编use*_*004的帖子

解析非标准XML(CDATA标记)

当我想使用BeautifulSoup库在Python中解析XML文档时,我遇到了一些问题.我要解析的XML文档:

<item>
<title><![CDATA[Title Sample]]></title>
<link /><![CDATA[http://banhada.kr/?cateCode=09&viewCode=S0941580]]>
<time_start>2011-10-10 09:00:00</time_start>
<time_end>2011-10-17 09:00:00</time_end>
<price_original>35000</price_original>
<price_now>20000</price_now>
</item>
Run Code Online (Sandbox Code Playgroud)

如上所示,标签有点奇怪.在我看来,(标签)不是一个立场XML形式,对吗?我该如何解析这种可怕的形式?

python xml beautifulsoup

5
推荐指数
2
解决办法
2万
查看次数

标签 统计

beautifulsoup ×1

python ×1

xml ×1