用于解析html的php正则表达式

gue*_*t86 0 html php regex

我需要一些帮助来解析一个html,从http://开始提取所有内容,包含"abc",直到第一次出现"或"或空格.

我有一些像这样的正则表达式/http:\/\/abc(.*)\"/但是效果不好:\

有什么想法吗?:)

PS抱歉英语不好,这不是我的自然语言;)

Jas*_*ary 5

StackOverflow倾向于使用HTML Document Parser而不是Regular Expressions来解析HTML.

但是,话虽如此,如果您只想要一个恰好是HTML的字符串中的URL,我仍然相信正则表达式可以胜任这项工作.

试试preg_match_all:

preg_match_all("/http:\/\/[^\s'\"]*abc[^\s'\"]*/", $string, $matches);
Run Code Online (Sandbox Code Playgroud)

  • 它不是Stack Overflow更喜欢用DOM解析HTML,它本身就比普通表达式更喜欢它.;) (3认同)
  • @netcoder,Fair,但是这个社区通常会为这些类型的问题尖叫HTML.虽然我尊重你的观点,但解析URL这样的东西与正则表达式完全有效. (3认同)