如何在Perl中修改本地HTML文件?

Jai*_*uri 0 html perl parsing

是否有CPAN模块或代码片段,我可以使用它来修改本地HTML文件而不使用regExp?

我想做的事 :

  1. 更改开始标记(例如:<div> to <div id="newtag">)
  2. 在另一个之前添加标签(例如:</head>to<script type="text/javascript"> ...</script></head>
  3. 删除标签
  4. 阅读给定标签的内容.(< - ok,这可以使用XML/HTML解析器完成.

cjm*_*cjm 5

如果你有HTML而不是XHTML,那么你不想使用XML解析器.

HTML :: Parser是Perl的标准HTML解析器.几乎所有其他东西都建立在它之上.

HTML :: TokeParser是HTML :: Parser的替代接口.它按需返回内容,而不是将所有内容传递给回调.

HTML :: TreeBuilder从HTML构建一个类似DOM的树,然后您可以修改它.

HTML :: TreeBuilder :: XPath扩展了HTML :: TreeBuilder并支持XPath.

HTML :: Query使用类似jQuery的选择器扩展HTML :: TreeBuilder.

pQuery是另一个为HTML :: TreeBuilder带来更完整的jQuery兼容性的模块.