正则表达式删除空的 html 标签,仅包含空的子标签

Cri*_*unu 2 html javascript regex jquery

我需要解析 HTML 字符串并删除仅包含空子元素的所有元素。

例子:

<P ALIGN="left"><FONT FACE="Arial" SIZE="12" COLOR="#000000" LETTERSPACING="0" KERNING="1"><B></B></FONT></P>
Run Code Online (Sandbox Code Playgroud)

不包含任何信息,必须替换为</br>

我写了一个像这样的正则表达式:

<\w+\b[^>]*>(<\w+\b[^>]*>\s*</\w*\s*>)*</\w*\s*>
Run Code Online (Sandbox Code Playgroud)

但问题是它只捕获了三个级别中的两个级别。在 abobe 示例中,<p>未选择元素(最外面的元素)。

你能帮我修复这个正则表达式吗?

Boh*_*ian 5

这个正则表达式似乎有效:

/(<(?!\/)[^>]+>)+(<\/[^>]+>)+/
Run Code Online (Sandbox Code Playgroud)

查看带有您的示例的现场演示