我需要匹配所有这些开始标记:
<p>
<a href="foo">
Run Code Online (Sandbox Code Playgroud)
但不是这些:
<br />
<hr class="foo" />
Run Code Online (Sandbox Code Playgroud)
我想出了这个,并希望确保我做对了.我只抓住了a-z.
<([a-z]+) *[^/]*?>
Run Code Online (Sandbox Code Playgroud)
我相信它说:
/,然后我有这个权利吗?更重要的是,你怎么看?
是否有一个内置的DLL将给我一个字符串链接列表.我想发送一个包含有效html的字符串,并解析所有链接.我似乎记得在.net或非托管库中内置了一些内容.
我找到了一些看起来很有前景的开源项目,但我认为有一个内置模块.如果不是,我可能不得不使用其中之一.如果没有必要的话,我现在不想要外部依赖.
C#:解析超链接及其描述的优秀正则表达式是什么?
请考虑不区分大小写,空白区域以及在HREF标记周围使用单引号(而不是双引号).
还请考虑获取标签中包含其他标签的超链接,<a>例如<b>和<i>.