正则表达式替换PHP中的html src属性

Ash*_*esh 10 html php regex

我正在尝试使用正则表达式替换PHP中的源属性(可能是图像或任何标记).

我有一个像这样的字符串:

$string2 = "<html><body><img src = 'images/test.jpg' /><img src = 'http://test.com/images/test3.jpg'/><video controls="controls" src='../videos/movie.ogg'></video></body></html>";
Run Code Online (Sandbox Code Playgroud)

我想把它变成:

$string2 = "<html><body><img src = 'test.jpg' /><img src = 'test3.jpg'/><video controls="controls" src='movie.ogg'></video></body></html>";
Run Code Online (Sandbox Code Playgroud)

继承人我试过的:

$string2 = preg_replace("/src=["']([/])(.*)?["'] /", "'src=' . convert_url('$1') . ')'" , $string2);
echo htmlentities ($string2);
Run Code Online (Sandbox Code Playgroud)

基本上它没有改变任何东西,并给了我一个关于未转义字符串的警告.

$1发送字符串的内容?这有什么不对?

而convert_url的功能来自我之前发布的一个例子:

function convert_url($url)
{
    if (preg_match('#^https?://#', $url)) {
        $url = parse_url($url, PHP_URL_PATH);
    }
    return basename($url);
}
Run Code Online (Sandbox Code Playgroud)

它应该删除url路径并返回文件名.

Sam*_*son 14

不要在HTML上使用正则表达式 - 使用DOMDocument该类.

$html = "<html>
           <body>
             <img src='images/test.jpg' />
             <img src='http://test.com/images/test3.jpg'/>
             <video controls='controls' src='../videos/movie.ogg'></video>
           </body>
         </html>";

$dom = new DOMDocument;  
libxml_use_internal_errors(true);

$dom->loadHTML( $html ); 
$xpath = new DOMXPath( $dom );
libxml_clear_errors();

$doc = $dom->getElementsByTagName("html")->item(0);
$src = $xpath->query(".//@src");

foreach ( $src as $s ) {
  $s->nodeValue = array_pop( explode( "/", $s->nodeValue ) );
}

$output = $dom->saveXML( $doc );

echo $output;
Run Code Online (Sandbox Code Playgroud)

其中输出如下:

<html>
  <body>
    <img src="test.jpg">
    <img src="test3.jpg">
    <video controls="controls" src="movie.ogg"></video>
  </body>
</html>
Run Code Online (Sandbox Code Playgroud)


ila*_*nco 1

你必须使用e修饰符。

$string = "<html><body><img src='images/test.jpg' /><img src='http://test.com/images/test3.jpg'/><video controls=\"controls\" src='../videos/movie.ogg'></video></body></html>";

$string2 = preg_replace("~src=[']([^']+)[']~e", '"src=\'" . convert_url("$1") . "\'"', $string);
Run Code Online (Sandbox Code Playgroud)

请注意,使用e修饰符时,替换脚本片段需要是字符串,以防止在调用 preg_replace 之前对其进行解释。