在notepad ++ regex中匹配所有出现的html元素属性

Question

在notepad ++ regex中匹配所有出现的html元素属性

我有一个文件,有这样的数百个链接:

<h3>aspnet</h3>
<a href="http://example.com/1" icon="data:image/png;base64,iwl1zecylifzn3fz9fr3l4cdjqhigcmjo9m">Ex 1</a>
<a href="http://example.com/2" icon="data:image/png;base64,ivborw0kggoaaaansuheugaaaqcayaaaaf8">Ex 2</a>
<a href="http://example.com/3" icon="data:image/png;base64,jmiaw+f2pwdohka6t+hnyfanbkwoa1olmug">Ex 3</a>

Run Code Online (Sandbox Code Playgroud)

所以我想删除所有元素

icon="data:image/png;base64,ivborw0kggoaaaansuheugaaabaaaaaqcayaaaaf8..."

来自各方面.我浏览了官方的Notepad ++正则表达式wiki,经过几次试验后得出了这个结论:

icon=\"[^\.]+\"

Run Code Online (Sandbox Code Playgroud)

问题是,它选择超过第二个双引号并在下一个双引号处停止.为了说明,这将选择以下内容:

icon="data:image/png;base64,...jbvebich4sec9zgth1sfue1cdt...">EX 1</a> <a href="

Run Code Online (Sandbox Code Playgroud)

如果我修改上面的正则表达式,

icon=\"[^\.]+\">

Run Code Online (Sandbox Code Playgroud)

然后它几乎是完美的,但它也选择了>:

icon="data:image/png;base64,...jbvebich4sec9zgth1sfue1cdt...">

Run Code Online (Sandbox Code Playgroud)

我正在寻找的正则表达式将选择如下:

icon="data:image/png;base64,...jbvebich4sec9zgth1sfue1cdt..."

Run Code Online (Sandbox Code Playgroud)

我也试过以下,但它根本不匹配

icon=\"[^\.]+\"$

Run Code Online (Sandbox Code Playgroud)

Answer 1

Sea*_*ght 5

只需匹配除引号之外的任何内容,然后引用:

icon="[^"]+"

Run Code Online (Sandbox Code Playgroud)

刚刚使用notepad ++ 6.2.2进行测试,并确认这与写入正确匹配.

细分:

icon="

Run Code Online (Sandbox Code Playgroud)

这是相当明显的,与文字文本相匹配icon=".

[^"]+

Run Code Online (Sandbox Code Playgroud)

这意味着匹配任何不是a的字符".添加+后它意味着"一次或多次".

最后我们匹配另一个文字".

归档时间：	13 年前
查看次数：	1346 次
最近记录：	13 年前