在href标记记事本++之间提取文本

mau*_*uro 0 regex notepad++

我有这个html页面:

<div class="abc">
<a href="www...." title="aaaaa">TEXTONE</a>
</div>

<div class="abc">
<a href="www...." title="bbbb">TEXTTWO</a>
</div>
Run Code Online (Sandbox Code Playgroud)

只有div类是相同的,我需要提取TEXTONE和TEXTTWO。我该如何使用查找功能?谢谢

vs9*_*s97 5

正确的方法是使用解析器,但是如果您想在Notepad ++的Find中使用快速脏的正则表达式...

尝试以下正则表达式:

\w+(?=<\/a>)            # match all [A-Za-z0-9_] before </a>
Run Code Online (Sandbox Code Playgroud)

正则表达式演示

如果文本可能包含空格,则可以使用以下正则表达式:

(?<=>).+(?=<\/a>)
Run Code Online (Sandbox Code Playgroud)

正则表达式演示

在此处输入图片说明