我正在尝试解析一些包含一些 HTML 实体的 HTML,例如 ×
$str = '<a href="http://example.com/"> A × B</a>';
$dom = new DomDocument;
$dom -> substituteEntities = false;
$dom ->loadHTML($str);
$link = $dom ->getElementsByTagName('a') -> item(0);
$fullname = $link -> nodeValue;
$href = $link -> getAttribute('href');
echo "
fullname: $fullname \n
href: $href\n";
Run Code Online (Sandbox Code Playgroud)
但是 DomDocument 将文本替换为 A × B。
有什么方法可以防止它为 HTML 实体使用 & 并让它不理会它吗?我试图将替换实体设置为假,但它没有做任何事情