在href标记记事本++之间提取文本

Question

我有这个html页面：

<div class="abc">
<a href="www...." title="aaaaa">TEXTONE</a>
</div>

<div class="abc">
<a href="www...." title="bbbb">TEXTTWO</a>
</div>

只有div类是相同的，我需要提取TEXTONE和TEXTTWO。我该如何使用查找功能？谢谢

Answer 1

正确的方法是使用解析器，但是如果您想在Notepad ++的Find中使用快速脏的正则表达式...

尝试以下正则表达式：

\w+(?=<\/a>)            # match all [A-Za-z0-9_] before </a>

如果文本可能包含空格，则可以使用以下正则表达式：

(?<=>).+(?=<\/a>)