我在使用正则表达式匹配html属性(在各种html标签中)时遇到问题.为此,我使用模式:
myAttr=\"([^']*)\"
Run Code Online (Sandbox Code Playgroud)
HTML片段:
<img alt="" src="1-p2.jpg" myAttr="http://example.com" class="alignleft" />
Run Code Online (Sandbox Code Playgroud)
它从myAttr
最后选择文本,/>
但我需要选择myAttr="..."
(" http://example.com ")
Ray*_*oal 23
你'
的角色类中有一个撇号(),但你想要一个引号("
).
myAttr=\"([^"]*)\"
Run Code Online (Sandbox Code Playgroud)
也就是说,你真的不应该用正则表达式解析HTML.(很抱歉再次链接到那个答案.对于那个问题还有其他答案,更多的是"如果你知道你在做什么......"变种.但是要注意这一点很好.)
请注意,即使您将regexing限制为仅属性,您还需要考虑很多因素:
这就是为什么通常需要预先构建的,严肃的解析器的原因.
归档时间: |
|
查看次数: |
20404 次 |
最近记录: |