正则表达式,用于从标记中删除属性

huf*_*ter 0 html regex asp.net

我感兴趣的是一个正则表达式,它接受HTML输入并删除标签内的所有属性,同时保持标签不变.比如我想要这个......

<p class="test" id="TestParagraph">This is some test text right here.</p>
Run Code Online (Sandbox Code Playgroud)

成为这个......

<p>This is some test text right here.</p>
Run Code Online (Sandbox Code Playgroud)

任何帮助将非常感激.

wom*_*omp 5

你真的不想为此使用正则表达式.HTML不是常规语言,您不能保证您的实际文本不会模仿标签并被剥离.无论你提出什么样的表达,总会有一些案例打破它.

我建议您使用Html Agility Pack进行任何需要执行的HTML操作.