存储数据的奇怪字符编码,旧脚本显示它们不是新的

max*_*max 2 php mysql database codeigniter character-encoding

我正在尝试重写一个旧网站.
它是在波斯语中使用perso/arabic字符.

CREATE DATABASE `db` DEFAULT CHARACTER SET utf8 COLLATE utf8_persian_ci;
USE `db`;
Run Code Online (Sandbox Code Playgroud)

几乎所有我的表/列COLLATE都设置为 utf8_persian_ci

我正在使用codeigniter来获取我的新脚本

'char_set' => 'utf8',
'dbcollat' => 'utf8_persian_ci',
Run Code Online (Sandbox Code Playgroud)

在数据库设置中,那里没有问题.

所以这是奇怪的部分

旧脚本使用某种称为数据库引擎TUBADBENGINETUBA DB ENGINE......没什么特别的.

当我使用旧脚本在数据库中输入一些数据(在波斯语中)时,当我查看数据库时,字符存储就像عمران .

旧脚本fetch /显示数据正常,但新脚本使用与数据库相同的奇怪字体/字符集显示它们

因此,当我进入时????,数据库存储的数据看起来像عمراÙ,当我在新脚本中获取它时,我看到,عمراÙ但在我看到 的旧脚本中????

CREATE TABLE IF NOT EXISTS `tnewsgroups` (
  `ID` int(11) NOT NULL AUTO_INCREMENT,
  `fName` varchar(200) COLLATE utf8_persian_ci DEFAULT NULL,
  PRIMARY KEY (`ID`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8 COLLATE=utf8_persian_ci AUTO_INCREMENT=11 ;

--
-- Dumping data for table `tnewsgroups`
--

INSERT INTO `tnewsgroups` (`ID`, `fName`) VALUES
(1, 'عمران'),
(2, 'معماری'),
(3, 'برق'),
(4, 'مکانیک'),
(5, 'test'),
(6, 'test2');
Run Code Online (Sandbox Code Playgroud)

另一方面,当我?????直接进入数据库

当然我有相同的????存储在数据库中

新脚本显示正常

但是在我得到的旧剧本中 ????

任何人都可以对此有任何意义吗?

这是大号发动机

https://github.com/maxxxir/mz-codeigniter-crud/blob/master/tuba.php

旧脚本的用法示例:

define("database_type" , "MYSQL");
define("database_ip" , "localhost");
define("database_un" , "root");
define("database_pw" , "");
define("database_name" , "nezam2");
define("database_connectionstring" , "");
$db = new TUBADBENGINE(database_type , database_ip , database_un , database_pw , database_name , database_connectionstring);
$db->Select("SELECT * FROM tnews limit 3");
if ($db->Lasterror() != "") { echo "<B><Font color=red>ÎØÇ ! áØÝÇ ãÌÏøÏÇ ÊáÇÔ ˜äíÏ";  exit(); }
for ($i = 0 ; $i < $db->Count() ; $i++) {
    $row = $db->Next();
    var_dump($row);
}
Run Code Online (Sandbox Code Playgroud)

dec*_*eze 13

简而言之,因为之前已经讨论了一千次:

  1. 例如,PHP包含一个"??"以UTF-8编码的字符串.这个字节是E6 BC A2 E5 AD 97.
  2. 它通过设置为latin1数据库连接发送此字符串.
  3. 数据库接收字节E6 BC A2 E5 AD 97,认为它们代表latin1字符.
  4. 数据库存储字符æ¼¢å­(E6 BC A2 E5 AD 97映射到的字符latin1).
  5. 相反的过程使PHP接收相同的字节,然后将其视为UTF-8.即使数据库没有按原样处理字符,往返也适用于PHP.

所以这里的问题是当数据输入数据库时​​数据库连接设置不正确.您必须将数据库中的数据转换为正确的字符.试试这个:

SELECT CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) FROM table_name
Run Code Online (Sandbox Code Playgroud)

实验可能utf8不是你需要的东西.如果可行,UPDATE请将其更改为语句以永久更新数据.

  • @Abdel5 转储数据库并使用正确/错误的导入/导出字符集组合重新导入它可能是最简单的方法。 (2认同)