- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在编写一个 Java(好的,Groovy,但这并不重要)迁移脚本来将 BLOB 字段从 Oracle10g 数据库复制到另一个数据库。数据由 MS Access 应用程序创建。这些文件的编码似乎不正确,我猜测 MS Access 或 ODBC 驱动程序以某种方式操纵了该文件。
使用查询 SELECT * FROM NLS_DATABASE_PARAMETERS WHERE PARAMETER = 'NLS_CHARACTERSET';
我发现源数据库具有字符集 WE8MSWIN1252
。
源表定义为:
CREATE TABLE CTR_DOCUMENTS (
CTR_ID NUMBER(11) NOT NULL,
CTR_A_ID NUMBER(11),
CTR_FILENAME VARCHAR2(260 Char) NOT NULL,
CTR_COMMENT VARCHAR2(255 Char),
CTR_DATE DATE,
CTR_DATA BLOB
)
我像这样 Access blob:
def blob = sourceDB.firstRow("SELECT CTR_DATA FROM CTR_DOCUMENTS WHERE CTR_ID = ?",
[id]).CTR_DATA
def blobSize = blob.length()
def blobStream = blob.getBinaryStream()
byte[] byteArray = new byte[blobSize]
blobStream.read(byteArray)
我将一些 blob 保存为文件,编码看起来很奇怪,文件无法被他们的程序打开。第二个字节始终为 00:
0000000: 2500 5000 4400 4600 2d00 3100 2e00 3500 %.P.D.F.-.1...5.
我还观察到使用 SQL 客户端(SQL Workbench/J、SQLDeveloper、TOAD) Access BLOBS 时的相同行为。
对我来说,看起来我必须将文件从 Windows-1252 转换为 UTF8,但这不起作用。我在这里遗漏了什么吗?
最佳答案
如果没有其他原因,出于诊断目的,我将从哪里开始扫描输入 BLOB 样本中的字节数组,以查看是否每个第二个字节实际上都是 0x00
,并每隔一个写入(非零)字节到 bytesOut
字节数组。如果成功,我会将 bytesOut
数组写入文件并查看它们现在是否是有效的 PDF 文档。例如:
public static void main(String[] args) {
try {
String connectionUrl = "";
connectionUrl =
"jdbc:sqlserver://localhost;" +
"instanceName=SQLEXPRESS;" +
"databaseName=myDb;" +
"integratedSecurity=true";
Connection con = DriverManager.getConnection(connectionUrl);
String SQL =
"SELECT CTR_ID, CTR_FILENAME, CTR_DATA " +
"FROM CTR_DOCUMENTS " +
"WHERE CTR_ID BETWEEN 1 AND 5";
Statement stmt = con.createStatement();
ResultSet rs = stmt.executeQuery(SQL);
while (rs.next()) {
boolean writeFile = true;
byte[] bytesIn = rs.getBytes("CTR_DATA");
//scan input byte array and copy every second byte to output byte array
byte[] bytesOut = new byte[bytesIn.length / 2];
for (int i = 0; i < bytesIn.length; i++) {
if ((i % 2) == 1) {
if (bytesIn[i] != 0x00) {
System.out.println(String.format("Darn. bytesIn value at offset %d is not 0x00. Skipping...", i));
writeFile = false;
break;
}
}
else {
bytesOut[i / 2] = bytesIn[i];
}
}
if (writeFile) {
String outFile =
"C:\\__tmp\\pdfTest\\" + rs.getString("CTR_FILENAME");
FileOutputStream fos = new FileOutputStream(outFile);
fos.write(bytesOut);
fos.close();
System.out.println(String.format("\"%s\" created.", outFile));
}
}
rs.close();
con.close();
} catch(Exception e) {
System.out.println(e.getMessage());
System.exit(0);
}
}
推理是,如果在某个过程中,某个进程采用了它认为是单字节字符的“字符串”(例如,Windows-1252)并通过简单地转换为 Unicode(例如,UCS-2LE)在每个字符后插入 0x00
(不以其他方式破坏实际数据字节),那么最直接的解决方案就是再次取出那些 0x00
字节。
关于java - 在使用 MS Access 创建的 Oracle10g 数据库中 Access BLOBS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20248894/
我目前正在尝试让 g++ 工作,并查看 http://gcc.gnu.org/install/build.html ,我似乎找不到它在哪里说如何“执行编译器的 3 阶段 bootstrap ”。我在哪
James Powell 在他对即将举行的演示文稿的简短描述中说,他自豪地发明了最粗糙的 Python 单行代码之一: (None for g in g if (yield from g) and F
请告诉我我的证明是否正确 We have a connected graph, and specific vertex u in V(G). Suppose we compute the dfs tr
下面的test2和test3结果是不同的。 我对此感到困惑,因为它看起来像相同的逻辑,并且与linux bash ||逻辑不同。 $data = @( [PSCustomObject]@{St
我试图找到一个明确的 G 代码语法规范,而不是单个 G 代码的含义,我无处不在的规范,我的意思是详细的语法规范,目的是编写解析器。 我编写解析器没有问题,我只是在寻找语法规范,例如。我知道您不必总是为
我写了这个 mixin,但它循环了很多时间。你能帮我优化我的代码吗?或者你能建议一些其他的东西来获得想要的结果吗? dfgdfgsdfgsdf 最佳答案 希望这就是您要找的。 $spaces: (4,
默认情况下,g++ 似乎会省略未使用的类内定义方法的代码。示例 from my previous question : struct Foo { void bar() {} void baz(
是否可以将文件内容通过管道传送到 g++编译程序? 我想这样做是因为我想使用数据库中的文件而不是磁盘上的物理文件。可以通过我制作的 API 轻松检索文件内容。 例如,我想做这样的事情: g++ con
如何profile c++代码获取每行代码的调用次数和消耗时间,就像profile工具一样在 Matlab 中呢? 我尝试使用-fprofile-arcs之类的东西,但它只生成代码覆盖率报告,其中可以
如何在几行代码上禁用所有警告。可以使用 GCC 诊断功能禁用特定警告,但是否有针对所有警告的标志。我尝试了这个方法,但不起作用 #pragma GCC diagnostic push #pragma
我有一个链接到 opencv 2.2 的可执行文件。但是,我删除了 opencv 2.2 并安装了 opencv 2.3。 问题是,有没有办法在不重新编译整个源代码的情况下将这个可执行文件链接到新的共
在编译带有一些标志的以下文件时,是否可以让 g++ 显示错误? #include using namespace std; int main() { int arr[ 2 ]; cout
在学习 Haskell 时,我遇到了一个挑战,要找到两个函数 f 和 g,例如 f g 和 f 。 g 是等价的(并且是总计,因此像 f = undefined 或 f = (.) f 这样的东西不算
根据我的理解,Theta 位于 Big O 和 Omega 之间,但我看到了这个声明,但我无法理解为什么交集会出现在这里。我能否对 Θ(g(n)) = O(g(n)) ∩ Ω(g(n)) 获得数学和分
我需要为这个递归函数编写一个迭代函数。 int funcRec(int n){ if(n>1) { return 2*funcRec(n - 1) + 3*funcRec(n
我在 github repository 上有代码示例并在 travis-ci 上创建了一个构建便于复制。 最小的、完整的和可验证的例子 可能不是最小的,但我相信它足够小 它使用 boost.inte
编辑:我们将调用箭头 p纯如果存在这样的函数f即:p = arr f . 我试图更好地掌握 Haskell 中的 Arrows,我想弄清楚什么时候 f >>> (g &&& h) = (f >>> g
我有两个(或更多)函数定义为: val functionM: String => Option[Int] = s => Some(s.length) val functionM2: Int => Op
好像是的。任何直观或严肃的证据都值得赞赏。 最佳答案 没有。 我认为您的问题等同于:给定函数 f 和 g,f 是 O(g) 或 g 是 O(f) 是否总是正确的?这在 SE Computer Scie
如果我设法证明 f(n) = o(g(n))(小 o),那么这两个函数的总和 f( n) + g(n) 应该被“更大”的函数 g(n) 紧紧束缚。 然而,我在证明这一点时遇到了一些麻烦。 最佳答案 以
我是一名优秀的程序员,十分优秀!