我想捕获所有没有特定标签的标签

sha*_*bby 1 .net c# regex

我想捕获名为'STRONG'的所有标签我可以使用<STRONG.*?</STRONG>这工作得很好但我不想捕获这些标签如果'SPAN'标签进来这些标签我想要这样的东西<STRONG.*(^(SPAN)).*?</STRONG> 是示例文本

<STRONG> For technical <SPAN id=PageBreak>101</SPAN> please</STRONG>
<SPAN id=PageBreak type="4">56</SPAN><STRONG> visit</STRONG>
Run Code Online (Sandbox Code Playgroud)

我想捕获第二个强标记,而不是第一个

Kon*_*lph 5

您正在尝试使用正则表达式解析HTML结构,因为HTML语言不规则,所以注定要失败(请参阅正式语言的层次结构).

请改用HTML解析器,例如HTML Agility Pack.另见这些 其他 问题.