我正在使用DOMDocument来操作/修改HTML,然后才能输出到页面.这只是一个html片段,而不是一个完整的页面.我最初的问题是所有的法国人都搞砸了,经过一番试错后我才能纠正.现在,似乎只有一个问题仍然存在:'角色变成了?.
代码 :
<?php
$dom = new DOMDocument('1.0','utf-8');
$dom->loadHTML(utf8_decode($row->text));
//Some pretty basic modification here, not even related to text
//reinsert HTML, and make sure to remove DOCTYPE, html and body that get added auto.
$row->text = utf8_encode(preg_replace('/^<!DOCTYPE.+?>/', '', str_replace( array('<html>', '</html>', '<body>', '</body>'), array('', '', '', ''), $dom->saveHTML())));
?>
Run Code Online (Sandbox Code Playgroud)
我知道utf8解码/编码会变得混乱,但这是迄今为止我能使它工作的唯一方法.这是一个示例字符串:
输入:Sans doute parce qu'il vient d'atteind datedéterminantedansson spectaculaire cheminement
产量:Sans doute parce qu?il vient d?atteindddddédédédanananandans son spectaculaire cheminement
如果我找到更多细节,我会添加它们.感谢您的时间和支持!