用于解析html的php正则表达式

Question

我需要一些帮助来解析一个html,从http://开始提取所有内容,包含"abc",直到第一次出现"或"或空格.

我有一些像这样的正则表达式/http:\/\/abc(.*)\"/但是效果不好:\

有什么想法吗？:)

PS抱歉英语不好,这不是我的自然语言;)

Answer 1

StackOverflow倾向于使用HTML Document Parser而不是Regular Expressions来解析HTML.

但是,话虽如此,如果您只想要一个恰好是HTML的字符串中的URL,我仍然相信正则表达式可以胜任这项工作.

preg_match_all("/http:\/\/[^\s'\"]*abc[^\s'\"]*/", $string, $matches);