PHP String Manipulation:提取hrefs

Ian*_*ugh 7 php string extract href

我有一个HTML字符串,我想检查它是否有任何内部链接,如果是这样,提取它们并将它们放在一个数组中.我可以使用其选择器的简单性在jQuery中执行此操作,但我找不到在PHP中使用的正确方法.

例如,字符串可能如下所示:

<h1>Doctors</h1>
<a title="C - G" href="linkl.html">C - G</a>
<a title="G - K" href="link2.html">G - K</a>
<a title="K - M" href="link3.html">K - M</a>
Run Code Online (Sandbox Code Playgroud)

如何(在PHP中)我可以把它变成一个看起来像这样的数组:

[1]=>"link1.html"
[2]=>"link2.html"
[3]=>"link3.html"
Run Code Online (Sandbox Code Playgroud)

谢谢,伊恩

Rus*_*ias 17

您可以使用PHP DOMDocument库来解析XML和/或HTML.类似下面的内容应该可以解决这个问题,href从HTML字符串中获取属性.

$html = '<h1>Doctors</h1>
<a title="C - G" href="linkl.html">C - G</a>
<a title="G - K" href="link2.html">G - K</a>
<a title="K - M" href="link3.html">K - M</a>';

$hrefs = array();

$dom = new DOMDocument();
$dom->loadHTML($html);

$tags = $dom->getElementsByTagName('a');
foreach ($tags as $tag) {
       $hrefs[] =  $tag->getAttribute('href');
}
Run Code Online (Sandbox Code Playgroud)