使用RegEx从HTML清除空格

Dav*_*ave 4 html javascript regex

RegEx是否可以清除HTML中的空格?

例如:

<p><b>foo</b> <i>bar</i></p>
<p>foo</p> <p>bar</p>
Run Code Online (Sandbox Code Playgroud)

在第一行,闭包b和开始i标签之间的空格是有效的(虽然它可能是a &nbsp;),但是在第二行它是我希望清理的空格,因为它不应该有任何语义值.

也许这可以通过DOM遍历更好地解决?

zie*_*mer 5

看起来像像HTML这样的东西对于你正在寻找的东西来说是一个更好的选择 - 而不是需要重新创建所有可能复杂的规则(例如你的例子中的第一个空格是重要的,但不是第二个,等等. )

否则,我同意 - DOM遍历将比正则表达式更好 - 特别是如果您的HTML已经符合XHTML并且可以轻松地以XML格式遍历.