myo*_*yol 1 php dom domdocument
我发现这个帖子很好地描述了我的问题,这个答案完全描述了我的问题.
非中断空格字符是字节0xA0是ISO-8859-1; 当编码为UTF-8时,它是0xC2,0xA0,如果您(错误地)将其视为ISO-8859-1,则表示为
"Â ".这包括一个尾随......
但是,我设法将我的问题跟踪到我用来在div中包装图像标签的函数.
function img_format($str)
{
$doc = new DOMDocument();
@$doc->loadHTML($str); // <-- Bonus points for the explaination of the @
// $tags object
$tags = $doc->getElementsByTagName('img');
foreach ($tags as $tag) {
$div = $doc->createElement('div');
$div->setAttribute('class','inner-copy');
$tag->parentNode->insertBefore($div, $tag);
$div->appendChild($tag);
$tag->setAttribute('class', 'inner-img');
}
$str = $doc->saveHTML();
return $str;
}
Run Code Online (Sandbox Code Playgroud)
很简单,我如何在此功能中解决此问题?
我理解使用;
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />
Run Code Online (Sandbox Code Playgroud)
将解决这个问题,但显然我在功能本身内忽略了一些东西.
我试过了;
$dom->validateOnParse = true;
Run Code Online (Sandbox Code Playgroud)
无济于事.(我不知道那是怎么回事)
找到了!
@$doc->loadHTML(mb_convert_encoding($str, 'HTML-ENTITIES', 'UTF-8'));
Run Code Online (Sandbox Code Playgroud)
这个答案解释了这个问题,并给出了上述工作;
除非另有说明,否则DOMDocument :: loadHTML会将您的字符串视为ISO-8859-1.这导致UTF-8字符串被错误地解释.
| 归档时间: |
|
| 查看次数: |
2946 次 |
| 最近记录: |