我真的很困惑PHP的正则表达式.
无论如何,我现在无法阅读整个教程的事情,因为我在html中有一堆文件,我必须尽快在那里找到链接.我提出了用PHP代码自动化它的想法,这是我所知道的语言.
所以我想我可以使用这个脚本:
$address = "file.txt";
$input = @file_get_contents($address) or die("Could not access file: $address");
$regexp = "??????????";
if(preg_match_all("/$regexp/siU", $input, $matches)) {
// $matches[2] = array of link addresses
// $matches[3] = array of link text - including HTML code
}
Run Code Online (Sandbox Code Playgroud)
我的问题是 $regexp
我需要的模式是这样的:
href="/content/r807215r37l86637/fulltext.pdf" title="Download PDF
Run Code Online (Sandbox Code Playgroud)
我想搜索并获取/content/r807215r37l86637/fulltext.pdf上面的行,我在文件中有很多这些行.
任何帮助?
==================
标题属性对我来说很重要,我想要的所有标题都是标题
title ="下载PDF"
保存您的理智并使用内置的DOM库.
$dom = new DOMDocument();
@$dom->loadHTML($html);
$x = new DOMXPath($dom);
$data = array();
foreach($x->query("//a[@title='Download PDF']") as $node)
{
$data[] = $node->getAttribute("href");
}
Run Code Online (Sandbox Code Playgroud)
编辑 基于ircmaxell评论的更新代码.
| 归档时间: |
|
| 查看次数: |
2674 次 |
| 最近记录: |