我有一个包含一千个 HTML 文件的集合,需要清理以进行打印。我需要删除<body></body>该区域内的所有标签,除了一个,<div.pg>。多余的是导航链接,它使打印件变得凌乱并耗尽纸张。标签的内容不一样,所以我无法找到和替换代码摘录,但标签是相同的,因为<table>要删除三个标签,每个标签都有特定的类。是否有任何批处理技术或软件来完成这项工作?我正在使用 Windows
<body></body>
<div.pg>
<table>
html batch
batch ×1
html ×1