无法通过PDO_ODBC从Access检索UTF-8重音字符

Chr*_*456 2 php ms-access odbc pdo utf-8

我试图将Access DB转换为MySQL.一切都很完美,期待一个大的猴子扳手...如果访问数据库有任何非标准字符,它将无法正常工作.我的询问会告诉我:

Incorrect string value: '\xE9d'
Run Code Online (Sandbox Code Playgroud)

如果我直接回显出具有"无效"字符的行文本,我在浏览器的黑色方块中会出现一个问号(因此é会在回声中变成无效的符号).

注意:相同的将接受,保存并显示用于标题此数据库上载的文本框中的"é"罚款.此外,如果我'保存为'页面并重新打开它''é'正确显示....

这是我如何连接:

$conn = new PDO("odbc:Driver={Microsoft Access Driver (*.mdb)};Dbq=$fileLocation;SystemDB=$securefilePath;Uid=developer;Pwd=pass;charset=utf;");
Run Code Online (Sandbox Code Playgroud)

我尝试了很多东西,包括:

$conn -> exec("set names utf8");
Run Code Online (Sandbox Code Playgroud)

当我在访问中尝试'CurrentDb.Collat​​ingOrder'时,它告诉我1033显然是dbSortGeneral用于"英语,德语,法语和葡萄牙语整理顺序".

怎么了?这几乎就像PDO向我发送了一个整理我的浏览器并且PHP并不完全理解.

Gor*_*son 11

问题

使用本机PHP ODBC功能(PDO_ODBC或旧odbc_功能)和Access ODBC驱动程序时,即使文本作为Unicode字符存储在Access数据库中,文本也不是UTF-8编码的.因此,对于名为"团队"的示例表

Team
-----------------------
Boston Bruins
Canadiens de Montréal
????????? ?????? ??????
Run Code Online (Sandbox Code Playgroud)

代码

<?php
header('Content-Type: text/html; charset=utf-8');
?>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Access character test</title>
</head>
<body>
<?php
$connStr = 
        'odbc:' .
        'Driver={Microsoft Access Driver (*.mdb)};' .
        'Dbq=C:\\Users\\Public\\__SO\\28311687.mdb;' .
        'Uid=Admin;';
$db = new PDO($connStr);
$db->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);

$sql = "SELECT Team FROM Teams";
foreach ($db->query($sql) as $row) {
    $s = $row["Team"];
    echo $s . "<br/>\n";
}
?>
</body>
</html>
Run Code Online (Sandbox Code Playgroud)

在浏览器中显示

Boston Bruins
Canadiens de Montr?al
????????? ?????? ??????
Run Code Online (Sandbox Code Playgroud)

简单但不完整的修复

Access返回的文本实际上匹配该字符集中字符的Windows-1252字符编码,因此只需更改该行

$s = $row["Team"];
Run Code Online (Sandbox Code Playgroud)

$s = utf8_encode($row["Team"]);
Run Code Online (Sandbox Code Playgroud)

将允许第二个条目正确显示

Boston Bruins
Canadiens de Montréal
????????? ?????? ??????
Run Code Online (Sandbox Code Playgroud)

utf8_encode()函数转换为ISO-8859-1,而不是Windows-1252,因此某些字符(特别是欧元符号'€')将消失.更好的解决方案是使用

$s = mb_convert_encoding($row["Team"], "UTF-8", "Windows-1252");
Run Code Online (Sandbox Code Playgroud)

但是仍然无法解决样本表中第三个条目的问题.

完整修复

对于完整的UTF-8支持,我们需要将COM与ADODB Connection和Recordset对象一起使用

<?php
header('Content-Type: text/html; charset=utf-8');
?>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Access character test</title>
</head>
<body>
<?php
$connStr = 
        'Driver={Microsoft Access Driver (*.mdb)};' .
        'Dbq=C:\\Users\\Public\\__SO\\28311687.mdb';
$con = new COM("ADODB.Connection", NULL, CP_UTF8);  // specify UTF-8 code page
$con->Open($connStr);

$rst = new COM("ADODB.Recordset");
$sql = "SELECT Team FROM Teams";
$rst->Open($sql, $con, 3, 3);  // adOpenStatic, adLockOptimistic
while (!$rst->EOF) {
    $s = $rst->Fields("Team");
    echo $s . "<br/>\n";
    $rst->MoveNext;
}
$rst->Close();
$con->Close();
?>
</body>
</html>
Run Code Online (Sandbox Code Playgroud)