gpt4 book ai didi

oracle - ORA_HASH函数使用的算法是什么?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:19:58 27 4
gpt4 key购买 nike

我在我正在处理的应用程序中遇到了一些代码,这些代码进行数据库调用只是为了调用 ORA_HASH UUID 字符串上的函数 ( documentation)。它这样做的原因是它需要该值来对另一个系统进行服务调用,该系统似乎使用 ORA_HASH 进行分区。

我想知道 ORA_HASH 使用的算法,以便我可以重新实现它,以便为无法访问真实数据库(更不用说 Oracle)的应用程序进行类似的服务调用.到目前为止,我只能找到相当于 Oracle API 文档的内容。

非常清楚:我需要克隆 ORA_HASH,因为这是我无法控制的另一个系统使用的,我需要与该系统集成。是的,如果可以使用 真正 标准算法(例如 MD5)就好了,但我不能,除非这就是 ORA_HASH 隐藏的内容。

建议使用 ORA_HASH 之外的哈希算法的答案或评论没有帮助。这个问题专门针对 ORA_HASH,而不是一般的散列或分区。

最佳答案

another system that appears to use ORA_HASH

好吧,如果它“似乎在使用”,那么进行一些逆向工程并检查究竟调用了什么并反汇编该函数的代码是有意义的。

但是,如果您想要深入了解 Oracle 内部结构,那么以下内容可能会有所帮助。

首先,你得搞清楚调用的是什么内部C函数。为此,您可以在一个 session 中执行一些长时间运行的代码。我确实运行了这个

select avg(ora_hash(rownum)) id from
(select rownum from dual connect by rownum <= 1e4),
(select rownum from dual connect by rownum <= 1e4);

也可以是PL/SQL代码,只要保证不断调用ora_hash就可以了。

运行时

我在 Windows 上测试过,看起来 ora_hash 是 ...->evaopn2()->evahash()->...

现在让我们用 google 搜索 evahash。我们非常幸运,因为官方网站上有一个头文件 https://oss.oracle.com/projects/ocfs-tools/src/branches/new-dir-format/libocfs/Linux/inc/ocfshash.h带有指向 evahash 的链接。

最后是包含实际 C 代码的页面 http://burtleburtle.net/bob/hash/evahash.html

到目前为止一切顺利,我们记得如果我们将它构建到库(Windows 上的 DLL)中,我们可以在 Oracle 中使用外部 C 函数。

例如在我的 Win x64 上,如果我将函数签名更改为

extern "C" ub4 hash( ub1 *k, ub4 length, ub4 initval)

从Oracle中可以成功执行。但是,如您所见,签名与 Oracle 中的 ora_hash 略有不同。此函数接受值、它的长度和 initval(可能是种子),而 Oracle 中的签名是 ora_hash(expr, max_bucket, seed_value)。

让我们尝试测试甲骨文

SQL> select ora_hash(utl_raw.cast_to_raw('0'), power(2, 32) - 1, 0) oh1,
2 ora_hash('0', power(2, 32) - 1, 0) oh2,
3 ora_hash(0, power(2, 32) - 1, 0) oh3,
4 ora_hash(chr(0), power(2, 32) - 1, 0) oh4
5 from dual;

OH1 OH2 OH3 OH4
---------- ---------- ---------- ----------
3517341953 3517341953 1475158189 4056412421

C

int main()
{
ub1 ta[] = {0};
ub1* t = ta;
cout << hash(t, 1, 0) << endl;
ub1 ta0[] = {'0'};
ub1* t0 = ta0;
cout << hash(t0, 1, 0) << endl;
return 0;
}

1843378377
4052366646

没有一个数字匹配。那么问题是什么?ora_hash 接受几乎任何类型的参数(例如 select ora_hash(sys.odcinumberlist(1,2,3)) from dual),而 C 函数接受值作为字节数组。这意味着一些转换发生在函数调用之前。因此,在使用提到的 C 哈希函数之前,您必须弄清楚实际值在传递给它之前是如何转换的。

您可以使用 IDA PRO + hex ray 对 Oracle 二进制文件进行逆向工程,但这可能需要几天时间。更不用说平台特定的细节。

所以如果你想模仿ora_hash,最简单的选择是安装Oracle express edition并用它来调用ora_hash。

我希望这很有趣。祝你好运。

更新

ora_hash 和 dbms_utility.get_hash_value 可以相互映射(参见 https://jonathanlewis.wordpress.com/2009/11/21/ora_hash-function/)

SQL> select dbms_utility.get_hash_value('0', 0 + 1, 1e6 + 1) ha1,
2 ora_hash('0', 1e6, 0) + 1 ha2
3 from dual;

HA1 HA2
---------- ----------
338437 338437

如果我们打开 dbms_utility 的包体,我们将看到以下声明

  function get_hash_value(name varchar2, base number, hash_size number)
return number is
begin
return(icd_hash(name, base, hash_size));
end;

  function icd_hash(name      varchar2,
base binary_integer,
hash_size binary_integer) return binary_integer;
pragma interface(c, icd_hash);

让我们用 google 搜索 icd_hash,我们可以发现它映射到 _psdhsh (https://yurichev.com/blog/50/)。现在是反汇编 oracle.exe 并从中提取 _psdhsh 代码的时候了。也许明年我会花一些时间在这上面。

关于oracle - ORA_HASH函数使用的算法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45948266/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com