发现PHP错误的PHP正则表达式

Sim*_*mon 2 php regex

我想要可以在页面上找到错误的PHP正则表达式.因此,当我访问网站并抓取页面时,我可以列出网站上的错误.

目前我有以下代码:

preg_match('/<b>.+<\/b>:.+ in <b>\/.+<\/b> on line <b>[0-9]+<\/b><br( \/)?>/msi',$html,$errors);
Run Code Online (Sandbox Code Playgroud)

它可以显示错误是否发生,但不会列出它们!我在数组中获得完整的html页面($errors[0])

有人可以帮忙吗?

编辑:所以我有一个页面,例如以下HTML源代码,我想从中提取PHP错误:

<b>Warning</b>:  session_start() [<a href='function.session-start'>function.session-start</a>]: The session id contains invalid characters, valid characters are only a-z, A-Z and 0-9 in <b>/home/.../public_html/articlescript/init.php</b> on line <b>127</b><br />
<br />
<b>Warning</b>:  session_start() [<a href='function.session-start'>function.session-start</a>]: Cannot send session cache limiter - headers already sent (output started at /home/.../public_html/articlescript/init.php:127) in <b>/home/.../public_html/articlescript/init.php</b> on line <b>127</b><br />
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">

<head>
    <title>...
Run Code Online (Sandbox Code Playgroud)

Gum*_*mbo 5

因为 - 嗯,你知道 - 你不应该使用正则表达式解析HTML,使用PHP的DOM库尝试这个:

libxml_use_internal_errors(true);
$doc = new DOMDocument();
$doc->loadHTML($str);
$messages = array();
foreach ($doc->getElementsByTagName('b') as $elem) {
    if (in_array($elem->textContent, array('Error', 'Warning', 'Notice'))) {
        $buffer = $elem->textContent;
        while ($elem->nextSibling !== null && strtolower($elem->nextSibling->localName) !== 'br') {
            $elem = $elem->nextSibling;
            $buffer .= $elem->textContent;
        }
        $messages[] = $buffer;
    }
}
Run Code Online (Sandbox Code Playgroud)

这将搜索B内容为"错误","警告"或"通知"之一的元素,并从那里获取文本内容直到下一个BR元素.初始调用libxml_use_internal_errors将阻止报告解析错误.