PHP:正则表达式搜索文件中的模式并将其拾取

Ali*_*eza 0 php regex search

我真的很困惑PHP的正则表达式.

无论如何,我现在无法阅读整个教程的事情,因为我在html中有一堆文件,我必须尽快在那里找到链接.我提出了用PHP代码自动化它的想法,这是我所知道的语言.

所以我想我可以使用这个脚本:

$address = "file.txt"; 
$input = @file_get_contents($address) or die("Could not access file: $address");
$regexp = "??????????"; 
if(preg_match_all("/$regexp/siU", $input, $matches)) { 
    // $matches[2] = array of link addresses 
   // $matches[3] = array of link text - including HTML code 
} 
Run Code Online (Sandbox Code Playgroud)

我的问题是 $regexp

我需要的模式是这样的:

href="/content/r807215r37l86637/fulltext.pdf" title="Download PDF
Run Code Online (Sandbox Code Playgroud)

我想搜索并获取/content/r807215r37l86637/fulltext.pdf上面的行,我在文件中有很多这些行.

任何帮助?

==================

编辑

标题属性对我来说很重要,我想要的所有标题都是标题

title ="下载PDF"

Byr*_*ock 5

再一次regexp 对于解析html不好的.

保存您的理智并使用内置的DOM库.

$dom = new DOMDocument();
@$dom->loadHTML($html);
$x = new DOMXPath($dom);
    $data = array();
foreach($x->query("//a[@title='Download PDF']") as $node)
{
    $data[] = $node->getAttribute("href");
}
Run Code Online (Sandbox Code Playgroud)

编辑 基于ircmaxell评论的更新代码.