所以我试图解析 HTML 页面并<p>使用get_elements_by_tag_name('p');
<p>
get_elements_by_tag_name('p');
问题是当我使用时$element->nodeValue,它返回奇怪的字符。文档首先$html使用 curl 加载,然后将其加载到 DOMDocument 中。
$element->nodeValue
$html
我确定这与字符集有关。
这是一个响应示例:“aujourd’hui”。
提前致谢。
php character-encoding domdocument nodevalue
character-encoding ×1
domdocument ×1
nodevalue ×1
php ×1