ped*_*nta 19 postgresql migration pgadmin
我的任务是将 PostgreSQL 8.2.x 数据库迁移到另一台服务器。为此,我使用 pgAdmin 1.12.2(顺便说一下,在 Ubuntu 11.04 上)并使用自定义/压缩格式 (.backup) 和 UTF8 编码的备份和还原。
原始数据库是 UTF8,如下所示:
-- Database: favela
-- DROP DATABASE favela;
CREATE DATABASE favela
WITH OWNER = favela
ENCODING = 'UTF8'
TABLESPACE = favela
CONNECTION LIMIT = -1;
Run Code Online (Sandbox Code Playgroud)
我正在目标服务器上完全像这样创建这个数据库。但是当我使用“恢复”选项从 .backup 文件恢复数据库时,它给了我一些以下错误:
pg_restore: restoring data for table "arena"
pg_restore: [archiver (db)] Error while PROCESSING TOC:
pg_restore: [archiver (db)] Error from TOC entry 2173; 0 35500 TABLE DATA arena favela
pg_restore: [archiver (db)] COPY failed: ERROR: invalid byte sequence for encoding "UTF8": 0xe3a709
HINT: This error can also happen if the byte sequence does not match the encoding expected by the server, which is controlled by "client_encoding".
CONTEXT: COPY arena, line 62
Run Code Online (Sandbox Code Playgroud)
当我检查哪个记录触发了这个错误时,实际上一些 vartext 字段具有像ç这样的变音字符(在葡萄牙语中使用,例如“caça”),当我从记录中的文本中手动删除它们时,错误会传递到下一条记录有它们 - 因为当复制有错误时,它会停止在该表上插入数据。而且我不想手动一一替换它们来完成此操作。
但这有点奇怪,因为使用 UTF8 不应该有这种问题,对吧?
我不知道他们最初是如何到达那里的。我只是在迁移数据库,我假设数据库在某种程度上就像在 LATIN1 中一样,然后被不正确地更改为 UTF8。
有什么方法可以检查表/数据库是否具有无效的 UTF8 序列?或者有什么方法可以将这些字符强制/重新转换为 UFT8,这样我在执行还原时就不会遇到任何问题?
提前致谢。
| 归档时间: |
|
| 查看次数: |
151063 次 |
| 最近记录: |