小编Bus*_*gue的帖子

使用Python和lxml仅剥离具有特定属性/值的标记

我熟悉etree strip_tagsstrip_elements方法,但我正在寻找一种直接的剥离标签(并留下其内容)只包含特定属性/值的方法.

例如:我想从树(l)中剥离具有属性/值的所有spandiv标记(或其他元素)(保留元素的内容就像那样).与此同时,那些相同的元素具备应保持不变.xhtmclass='myclass'strip_tagsclass='myclass'

相反:我想要一种剥去所有"裸体" spansdivs树木的方法.仅表示那些完全没有属性的spans/ divs(或任何其他元素).留下那些具有属性(任何)的相同元素不变.

我觉得我错过了一些明显的东西,但是我一直在寻找没有任何运气的时间.

python lxml

10
推荐指数
1
解决办法
3627
查看次数

标签 统计

lxml ×1

python ×1