Ind*_*ana 5 linux sqlite ms-access encoding codepages
问候,我会陈述我的情况:
这是我为转换数据库所做的bash脚本.假设我有MS Access x.MDB
mdb-schema "x.mdb" | perl -wpe 's%^DROP TABLE %DROP TABLE IF EXISTS %i;
s%(Memo/Hyperlink|DateTime( \(Short\))?)%TEXT%i;
s%(Boolean|Byte|Byte|Numeric|Replication ID|(\w+ )?Integer)%INTEGER%i;
s%(BINARY|OLE|Unknown ([0-9a-fx]+)?)%BLOB%i;
s%\s*\(\d+\)\s*(,?[ \t]*)$%${1}%;' | sqlite3 > x.db
for i in $(mdb-tables "x.mdb"); do echo $i; (
echo "BEGIN TRANSACTION;";
MDB_JET3_CHARSET="WINDOWS-1256" mdb-export -R ";\n" -I "x.mdb" $i;
echo "END TRANSACTION;" ) | sqlite3 "x.db"; done
Run Code Online (Sandbox Code Playgroud)
我试图将MDB_JET3_CHARSET更改为WINDOWS-1256,cp1256,WINDOWS-1251,cp1251,UTF-8.当我浏览数据时,有些会在数据中产生不同的结果,但仍然没有任何意义.
谢谢你,对不起我的英语不好
好吧,在玩了很多网站之后,我偶然发现了这个http://git.ojuba.org/cgit/thawab/tree/并找到了一个给我一个想法的脚本(如果有人好奇的话,它就是 bok2ki.py),我喜欢开源!!:)
我添加带有“UTF-8”值的 MDB_ICONV 参数,并将 MDB_JET3_CHARSET 参数值更改为“cp1256”
实际上我真的不知道这些参数到底是什么,但我猜测 MDB_JET3 CHARSET 是定义字符集/编码/代码页(我真的不知道区别,我应该研究更多)而 MDB_ICONV 是定义目标数据库的编码。无论如何,这些只是我的假设。
那么这是我的新脚本:
mdb-schema "x.mdb" | perl -wpe 's%^DROP TABLE %DROP TABLE IF EXISTS %i;
s%(Memo/Hyperlink|DateTime( \(Short\))?)%TEXT%i;
s%(Boolean|Byte|Byte|Numeric|Replication ID|(\w+ )?Integer)%INTEGER%i;
s%(BINARY|OLE|Unknown ([0-9a-fx]+)?)%BLOB%i;
s%\s*\(\d+\)\s*(,?[ \t]*)$%${1}%;' | sqlite3 x.db
for i in $(mdb-tables "x.mdb"); do echo $i; (
echo "BEGIN TRANSACTION;";
MDB_JET3_CHARSET="cp1256" MDB_ICONV="UTF-8" mdb-export -R ";\n" -I "x.mdb" $i;
echo "END TRANSACTION;" ) | sqlite3 "x.db"; done
Run Code Online (Sandbox Code Playgroud)