如何使用正则表达式在特定div和特定锚标记内获取img标记值

Sun*_*aga 2 php regex html-parsing

我是正则表达式的新手,我尝试了很多用于获取锚标记内的图像标记值html这是我的html表达

<div class="smallSku" id="ctl00_ContentPlaceHolder1_smallImages">
                                <a title="" name="http://www.playg.in/productImages/med/PNC000051_PNC000051.jpg" href="http://www.playg.in/productImages/lrg/PNC000051_PNC000051.jpg" onclick="return showPic(this)" onmouseover="return showPic(this)">
    <img border="0" alt="" src="http://www.playg.in/productImages/thmb/PNC000051_PNC000051.jpg"></a>    <a title="PNC000051_PNC000051_1.jpg" name="http://www.playg.in/productImages/med/PNC000051_PNC000051_1.jpg" href="http://www.playg.in/productImages/lrg/PNC000051_PNC000051_1.jpg" onclick="return showPic(this)" onmouseover="return showPic(this)">
    <img border="0" alt="PNC000051_PNC000051_1.jpg" src="http://www.playg.in/productImages/thmb/PNC000051_PNC000051_1.jpg"></a>
                        </div>
Run Code Online (Sandbox Code Playgroud)

我想只返回图像标签的src值,我尝试了"preg_match_all()"中的匹配模式,模式是

"@<div[\s\S]class="smallSku"[\s\S]id="ctl00_ContentPlaceHolder1_smallImages"\><a title=\"\" name="[\w\W]" href="[\w\W]" onclick=\"[\w\W]" onmouseover="[\w\W]"\><img[\s\S]src="(.*)"[\s\S]></a><\/div>@"
Run Code Online (Sandbox Code Playgroud)

请帮助我尝试了很多时间,这也试过这个链接太匹配图像标签没有嵌套在锚标签使用正则表达式

小智 5

正则表达式不是解析HTML的正确工具.请参阅此常见问题解答:如何解析和处理HTML/XML?

以下是如何src使用您的示例获取属性的示例:

$doc = new DOMDocument();
$doc->loadHTML($your_html_string);
$xpath = new DOMXPath($doc);

foreach ($xpath->query('//div[@class="smallSku"]/a/img/@src') as $attr) {
    $src = $attr->value;
    print $src;
}
Run Code Online (Sandbox Code Playgroud)