gpt4 book ai didi

linux - MS Access *.MDB 转换为 MySQL 或 SQLite,数据编码问题

转载 作者:IT王子 更新时间:2023-10-29 00:33:36 34 4
gpt4 key购买 nike

您好,我来介绍一下我的情况:

  • 我使用的是 Linux UBUNTU
  • 我有几个 Jet3 .MDB(MS Acess 数据库),每个大约 500MB,其中数据编码为 cp1256/WINDOWS-1256
  • 我已经按照这篇文章制作了 sqlite 数据库来进行转换 http://cltb.ojuba.org/en/articles/mdb2sqlite .

这是我用来转换数据库的 bash 脚本。假设我有 MS Access x.MDB

mdb-schema "x.mdb" | perl -wpe 's%^DROP TABLE %DROP TABLE IF EXISTS %i;
s%(Memo/Hyperlink|DateTime( \(Short\))?)%TEXT%i;
s%(Boolean|Byte|Byte|Numeric|Replication ID|(\w+ )?Integer)%INTEGER%i;
s%(BINARY|OLE|Unknown ([0-9a-fx]+)?)%BLOB%i;
s%\s*\(\d+\)\s*(,?[ \t]*)$%${1}%;' | sqlite3 > x.db

for i in $(mdb-tables "x.mdb"); do echo $i; (
echo "BEGIN TRANSACTION;";
MDB_JET3_CHARSET="WINDOWS-1256" mdb-export -R ";\n" -I "x.mdb" $i;
echo "END TRANSACTION;" ) | sqlite3 "x.db"; done

我尝试将 MDB_JET3_CHARSET 更改为 WINDOWS-1256、cp1256、WINDOWS-1251、cp1251、UTF-8。有些在我浏览数据时会产生不同的结果,但仍然毫无意义。

谢谢之前,抱歉我的英语不好

最佳答案

好吧,在浏览了很多网站之后,我偶然发现了这个 http://git.ojuba.org/cgit/thawab/tree/并找到了一个给我灵感的脚本(它是 bok2ki.py,如果有人好奇的话),我喜欢开源!! :)

我添加值为“UTF-8”的 MDB_ICONV 参数,并将 MDB_JET3_CHARSET 参数值更改为“cp1256”

实际上我真的不知道那些参数到底是什么,但我猜 MDB_JET3 CHARSET 是定义字符集/编码/代码页(我真的不知道区别,我应该研究更多)和 MDB_ICONV是定义目标数据库的编码。好吧,无论如何,这些只是我的假设。

然后这是我的新脚本:

mdb-schema "x.mdb" | perl -wpe 's%^DROP TABLE %DROP TABLE IF EXISTS %i;
s%(Memo/Hyperlink|DateTime( \(Short\))?)%TEXT%i;
s%(Boolean|Byte|Byte|Numeric|Replication ID|(\w+ )?Integer)%INTEGER%i;
s%(BINARY|OLE|Unknown ([0-9a-fx]+)?)%BLOB%i;
s%\s*\(\d+\)\s*(,?[ \t]*)$%${1}%;' | sqlite3 x.db

for i in $(mdb-tables "x.mdb"); do echo $i; (
echo "BEGIN TRANSACTION;";
MDB_JET3_CHARSET="cp1256" MDB_ICONV="UTF-8" mdb-export -R ";\n" -I "x.mdb" $i;
echo "END TRANSACTION;" ) | sqlite3 "x.db"; done

关于linux - MS Access *.MDB 转换为 MySQL 或 SQLite,数据编码问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6068961/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com