algorithm - 如何使用按位运算符找到 n 位整数的对数基数 2 的底？-6ren

algorithm - 如何使用按位运算符找到 n 位整数的对数基数 2 的底？

转载作者：行者123 更新时间：2023-12-04 14:53:13

26

4

我有一个程序，需要非常频繁地计算一个整数的 log-base-2 的下限。作为结果，标准库的 log2 方法在我选择的语言(C++ 中的 floor(std::log2([INT])) 来自 <cmath>)中的性能并不令人满意，我想实现该算法的最快版本。我在网上找到了使用按位运算符计算 32 位和 64 位整数的这个值的版本:

INT Y(log2i)(const INT m)
{
  /* Special case, zero or negative input. */
  if (m <= 0)
    return -1;

#if SIZEOF_PTRDIFF_T == 8
  /* Hash map with return values based on De Bruijn sequence. */
  static INT debruijn[64] =
  {
    0, 58, 1, 59, 47, 53, 2, 60, 39, 48, 27, 54, 33, 42, 3, 61, 51, 37, 40, 49,
    18, 28, 20, 55, 30, 34, 11, 43, 14, 22, 4, 62, 57, 46, 52, 38, 26, 32, 41,
    50, 36, 17, 19, 29, 10, 13, 21, 56, 45, 25, 31, 35, 16, 9, 12, 44, 24, 15,
    8, 23, 7, 6, 5, 63
  };

  register uint64_t v = (uint64_t)(m);

  /* Round down to one less than a power of 2. */
  v |= v >> 1;
  v |= v >> 2;
  v |= v >> 4;
  v |= v >> 8;
  v |= v >> 16;
  v |= v >> 32;

  /* 0x03f6eaf2cd271461 is a hexadecimal representation of a De Bruijn
   * sequence for binary words of length 6. The binary representation
   * starts with 000000111111. This is required to make it work with one less
   * than a power of 2 instead of an actual power of 2.
   */
  return debruijn[(uint64_t)(v * 0x03f6eaf2cd271461LU) >> 58];
#elif SIZEOF_PTRDIFF_T == 4
  /* Hash map with return values based on De Bruijn sequence. */
  static INT debruijn[32] =
  {
    0, 9, 1, 10, 13, 21, 2, 29, 11, 14, 16, 18, 22, 25, 3, 30, 8, 12, 20, 28,
    15, 17, 24, 7, 19, 27, 23, 6, 26, 5, 4, 31
  };

  register uint32_t v = (uint32_t)(m);

  /* Round down to one less than a power of 2. */
  v |= v >> 1;
  v |= v >> 2;
  v |= v >> 4;
  v |= v >> 8;
  v |= v >> 16;

  /* 0x07C4ACDD is a hexadecimal representation of a De Bruijn sequence for
   * binary words of length 5. The binary representation starts with
   * 0000011111. This is required to make it work with one less than a power of
   * 2 instead of an actual power of 2.
   */
  return debruijn[(uint32_t)(v * 0x07C4ACDDU) >> 27];
#else
#error Incompatible size of ptrdiff_t
#endif
}

(以上代码取自 this link ；所述代码引用的注释 this page ，简要概述了算法的工作原理)。
我需要为 256 位整数实现这个算法的一个版本。 n 位整数的一般形式相当容易理解: (1) 从具有 n 个条目的 Debruijn 序列创建一个整数数组； (2) 对有问题的整数执行就地按位或右移 2^i for i=1...(n/2); (3) 返回 Debruijn 数组的一些条目，其索引等于整数乘以右移另一个常数的常数。
第三步是我困惑的地方。究竟是如何推导的 0x07C4ACDDU和 0x03f6eaf2cd271461LU分别作为 32 位和 64 位的乘法常数？怎么推导 58和 27作为应该右移的常数？特别是对于 256 位整数，这些值是什么？
提前致谢。对不起，如果这很明显，我在数学方面没有受过很好的教育。

最佳答案

我同意哈罗德的观点 std::countl_zero()是要走的路。内存
自从这个比特摆弄以来，相对于计算已经慢了很多
hack 是设计的，并且处理器通常具有内置指令。
然而，为了回答你的问题，这个 hack 结合了几个
原语。 (当我谈到位索引时，我是从大多数到
最不重要，从零开始计数。)

以 v |= v >> 1; 开头的行序列达到其
四舍五入到最接近的二减一的幂的既定目标
(即，二进制表示与 0*1* 匹配的数字)由
将每一位设置在至少一个设置位的右侧。

这些行都没有清除 v 中的位.

由于只有右移，这些行设置的每一位
位于至少一个设置位的右侧。

给定位置 i 的设置位，我们观察到一点在
职位i + delta将保证由行设置
匹配 delta的二进制表示，例如，delta = 13(二进制 1101)由v |= v >> 1; v |= v >> 4; v |= v >> 8; .

提取位 [L, L+delta)来自一个无符号整数 n和WIDTH位可以用 (n << L) >> (WIDTH - delta) 完成.
左移截断应丢弃的高位，
和右移，在 C++ 中对于无符号是合乎逻辑的，截断
低位并用零填充截断的高位。

鉴于答案是 k , 我们要提取 5 (= log2(32), for
32 位)或 6(= log2(64)，对于 64 位)位，以索引 k 开头
来自魔法常数n .我们不能通过 k 转移因为我们只
知道 pow2(k) (有点，我稍后会讲到)，但我们可以
使用乘以 pow2(k) 之间的等价关系走了
换档 k作为解决方法。

其实我们只知道pow2(k+1) - 1 .我们会变得贪婪
删除我们需要获得的两个操作 pow2(k) .通过放置 5 或 6
在初始零之后的那些，我们强制负一总是
导致答案比应有的少一(mod 32 或
64)。

所以 de Bruijn 序列:这个想法是我们可以唯一地识别
通过读取接下来的 5 或 6 位，我们在序列中的索引。我们不是
很幸运能够让这些位等于索引，
这就是查找表的用武之地。

作为一个例子，我将这个算法适用于 8 位字。我们从

v |= v >> 1;
v |= v >> 2;
v |= v >> 4;

de Bruijn 序列是 00011101 , 用三位写出
段是

(索引 - 1)mod 8
位
值(value)
(值 - 1)mod 8

7
000
0
7

0
001
1
0

1
011
3
2

2
111
7
6

3
110
6
5

4
101
5
4

5
010
2
1

6
100
4
3

十六进制常数是 0x1D ，右移是 8 − log2(8) = 5，
表格是通过反转上面的排列得出的: {0, 5, 1, 6, 4, 3, 2, 7} .
因此，假设，如果我们想将此算法调整为 256 位
字大小，我们将添加 v |= v >> 64; v |= v >> 128; , 将移位更改为
256 − log2(256) = 256 − 8 = 248，找到一个 256 位的 de Bruijn 序列
以 0000000011111111 开头，将其编码为十六进制常量，并且
构建适当的查找表以与之配对。
但是，不要。如果你坚持不使用库函数，你就是
仍然可能在 64 位机器上，所以你应该测试每个
从大到小的四个词中的一个非零，如果是，则应用
64 位代码并添加适当的偏移量。

关于algorithm - 如何使用按位运算符找到 n 位整数的对数基数 2 的底？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/68677658/

26

4

0

文章推荐： javascript - 如何对强制回流的 Javascript 操作进行分组？

文章推荐： r - 从两个不同的数据帧绘制 R 图

文章推荐： typescript - 推断函数的参数列表

文章推荐： java - Maven构建多模块项目成功，Eclipse报错

javascript - 使用 WebScriptEndpoint 使用 javascript 使用 WCF 服务
我在网上搜索但没有找到任何合适的文章解释如何使用 javascript 使用 WCF 服务，尤其是 WebScriptEndpoint。任何人都可以对此给出任何指导吗？谢谢最佳答案这是一篇关于
c - 没有结果!!使用 fork() 使用 dup2 使用 2 个管道运行 execlp()
我正在编写一个将运行 Linux 命令的 C 程序，例如: cat/etc/passwd | grep 列表 |剪切-c 1-5 我没有任何结果 *这里 parent 等待第一个 child (chi
python - 处理文件上传，使用 Pillow 调整大小，使用 SQLAlchemy 存储，使用 Flask 提供文件
所以我正在尝试处理文件上传，然后将该文件作为二进制文件存储到数据库中。在我存储它之后，我尝试在给定的 URL 上提供文件。我似乎找不到适合这里的方法。我需要使用数据库，因为我使用 Google 应用引
excel - 使用 IF 使用 VBA 在单元格中添加公式的问题
我正在尝试制作一个宏，将下面的公式添加到单元格中，然后将其拖到整个列中并在 H 列中复制相同的公式我想在 F 和 H 列中输入公式的数据 Range("F1").formula = "=IF(ISE
使用 OperatorPrecedenceParser 使用 FParsec 解析函数应用程序？
问题类似于this one ，但我想使用 OperatorPrecedenceParser 解析带有函数应用程序的表达式在 FParsec . 这是我的 AST: type Expression =
sql - 使用 sequelize 使用 where 查询编码计数
我想通过使用 sequelize 和 node.js 将这个查询更改为代码取决于在哪里 select COUNT(gender) as genderCount from customers where
bash - 使用 “let”分配Bash失败，使用 “/”
我正在使用GNU bash，版本5.0.3(1)-发行版(x86_64-pc-linux-gnu)，我想知道为什么简单的赋值语句会出现语法错误: #/bin/bash var1=/tmp
javascript - 使用 JavaScript 使用 FOR OF 数组循环时出现错误？
这里，为什么我的代码在 IE 中不起作用。我的代码适用于所有浏览器。没有问题。但是当我在 IE 上运行我的项目时，它发现错误。而且我的 jquery 类和 insertadjacentHTMl 也不
javascript - 使用 javascript 使用 for 属性更改表单标签内容
我正在尝试更改标签的innerHTML。我无权访问该表单，因此无法编辑 HTML。标签具有的唯一标识符是“for”属性。这是输入和标签的结构:
javascript - 使用 jquery 使用 .on() 将事件附加到页面上的动态插入按钮
我有一个页面，我可以在其中返回用户帖子，可以使用一些 jquery 代码对这些帖子进行即时评论，在发布新评论后，我在帖子下插入新评论以及删除按钮。问题是 Delete 按钮在新插入的元素上不起作用，
使用 awk 使用 sha1sum 进行散列
我有一个大约有 20 列的“管道分隔”文件。我只想使用 sha1sum 散列第一列，它是一个数字，如帐号，并按原样返回其余列。使用 awk 或 sed 执行此操作的最佳方法是什么？ Accounti
mysql - 使用 insert into 使用 mysql
我需要将以下内容插入到我的表中...我的用户表有五列 id、用户名、密码、名称、条目。 (我还没有提交任何东西到条目中，我稍后会使用 php 来做)但由于某种原因我不断收到这个错误:#1054 - U
jquery - 将输入字段值修剪为仅字母数字字符/使用 .使用 jQuery
所以我试图有一个输入字段，我可以在其中输入任何字符，但然后将输入的值小写，删除任何非字母数字字符，留下“。”而不是空格。例如，如果我输入: 地球的 70% 是水，-!*#$^^ & 30% 土地输
javascript - 使用 .innerHTML 使用 DOM
我正在尝试做一些我认为非常简单的事情，但出于某种原因我没有得到想要的结果？我是 javascript 的新手，但对 java 有经验，所以我相信我没有使用某种正确的规则。这是一个获取输入值、检查选择
php - 使用 angularjs 使用 where 子句从数据库获取数据
我想使用 angularjs 从 mysql 数据库加载数据。这就是应用程序的工作原理；用户登录，他们的用户名存储在 cookie 中。该用户名显示在主页上我想获取这个值并通过 angularjs
ios - 使用 UITableViewCell 使用 AutoLayout
我正在使用 autoLayout，我想在 UITableViewCell 上放置一个 UIlabel，它应该始终位于单元格的右侧和右侧的中心。这就是我想要实现的目标所以在这里你可以看到我正在谈论的
mysql - 使用 ElasticSearch 使用 or 和运算符搜索多个字段
我需要与 MySql 等效的 elasticsearch 查询。我的 sql 查询: SELECT DISTINCT t.product_id AS id FROM tbl_sup_price t
ios - 使用 Swift 使用 JSON
我正在实现代码以使用 JSON。 func setup() { if let flickrURL = NSURL(string: "https://api.flickr.com/
javascript - 使用 JavaScript 使用 for 循环声明变量
我尝试使用for循环声明变量，然后测试cols和rols是否相同。如果是，它将运行递归函数。但是，我在 javascript 中执行 do 时遇到问题。有人可以帮忙吗？现在，在比较 col.1 和
jquery - 使用 :after 使用 jquery 更改样式
我举了一个我正在处理的问题的简短示例。 HTML代码: 1 2 3 CSS 代码: .BB a:hover{ color: #000; } .BB > li:after {

首页

博学

6Ren·AI

商城

algorithm - 如何使用按位运算符找到 n 位整数的对数基数 2 的底？