相关疑难解决方法(0)

检测编码并使所有内容UTF-8

我正在从各种RSS源中读出大量文本并将它们插入到我的数据库中.

当然,在馈送中使用了几种不同的字符编码,例如UTF-8和ISO-8859-1.

不幸的是,有时文本的编码存在问题.例:

"Fußball"中的"ß"应该在我的数据库中看起来像这样:"ÂŸ".如果是"ÂŸ",则会正确显示.
有时,"Fußball"中的"ß"在我的数据库中看起来像这样:"ÃƒÂŸ".当然,它显示错误.
在其他情况下,"ß"保存为"ß" - 所以没有任何改变.然后它也显示错误.

我该怎么做才能避免案例2和3？

如何使所有内容编码相同,最好是UTF-8？我utf8_encode()什么时候必须使用,什么时候必须使用utf8_decode()(很清楚效果是什么,但什么时候必须使用这些功能？)什么时候我必须对输入什么都不做？

你能帮助我并告诉我如何使一切编码相同吗？也许有功能mb_detect_encoding()？我能为此写一个函数吗？所以我的问题是:

如何找出文本使用的编码？
如何将其转换为UTF-8 - 无论旧的编码是什么？

像这样的功能会起作用吗？

function correct_encoding($text) {
    $current_encoding = mb_detect_encoding($text, 'auto');
    $text = iconv($current_encoding, 'UTF-8', $text);
    return $text;
}

Run Code Online (Sandbox Code Playgroud)

我已经测试了它,但它不起作用.它出什么问题了？

php encoding utf-8 character-encoding

caw*_*caw

2019 07-09

293
推荐指数

7
解决办法

34万
查看次数

标签统计

character-encoding ×1

encoding ×1

php ×1

utf-8 ×1

检测编码并使所有内容UTF-8

标签 统计

标签统计