正则表达式以http开头并以pdf结尾？

Question

我已经加载了整个页面的HTML,并希望检索所有以http开头并以pdf结尾的URL.我写了以下哪些不起作用:

$html = file_get_contents( "http://www.example.com" );
preg_match( '/^http(pdf)$/', $html, $matches );

我对正则表达式很新,但是从我学到的东西^标志着一个模式的开始并$标志着结束.我究竟做错了什么？

Answer 1

您需要匹配URL中间的字符:

/\bhttp[\w%+\/-]+?pdf\b/

Answer 2

preg_match( '/http[^\s]+pdf/', $html, $matches );

匹配http后跟非 ( [^...]) 空格 ( \s) 一次或多次 ( +) 后跟pdf