- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
>> mask = 0xFFFFFFFF >>> print("{} {:b}".forma-6ren">
>>> x = -4
>>> print("{} {:b}".format(x, x))
-4 -100
>>> mask = 0xFFFFFFFF
>>> print("{} {:b}".format(x & mask, x & mask))
4294967292 11111111111111111111111111111100
>>>
>>> x = 0b11111111111111111111111111111100
>>> print("{} {:b}".format(x, x))
4294967292 11111111111111111111111111111100
>>> print("{} {:b}".format(~(x ^ mask), ~(x ^ mask)))
-4 -100
我无法弄清楚 Python 如何表示负整数,以及位运算的工作原理。据我了解,Python 试图模拟二进制补码,但具有任意数量的位。因此,通常使用 32 位掩码强制 Python 在位操作之前设置整数的标准大小。
正如您在我的示例中看到的,-4 & 0xFFFFFFFF
产生了一个很大的正数。为什么 Python 似乎将其读取为无符号整数,而不是二进制补码负数?稍后,操作 ~(x ^ mask)
应该产生与大正数完全相同的二进制补码位模式,而不是给出 -4
。是什么导致转换为有符号整数?
谢谢!
最佳答案
TLDR; CPython 整数类型将符号存储在结构的特定字段中。执行按位运算时,CPython 将负数替换为二进制的补码,有时 (!) 执行相反的操作(即用负数替换二进制的补码)。
整数的内部表示是一个 PyLongObject
结构,它包含一个 PyVarObject
结构。 (当 CPython 创建一个新的 PyLong
对象时,它为结构分配内存并为数字分配尾随空间。)这里重要的是 PyLong
的大小:ob_size
嵌入式结构的 PyVarObject
字段包含大小(以数字为单位)整数(数字是 15 位或 30 位数字)。如果整数为负数,则此大小为减去位数。
(引用:https://github.com/python/cpython/blob/master/Include/object.h 和 https://github.com/python/cpython/blob/master/Include/longobject.h)
如您所见,内部 CPython 对整数的表示与通常的二进制表示相去甚远。然而,CPython 必须为各种目的提供按位运算。我们来看看the code中的评论:
static PyObject *
long_bitwise(PyLongObject *a,
char op, /* '&', '|', '^' */
PyLongObject *b)
{
/* Bitwise operations for negative numbers operate as though
on a two's complement representation. So convert arguments
from sign-magnitude to two's complement, and convert the
result back to sign-magnitude at the end. */
/* If a is negative, replace it by its two's complement. */
/* Same for b. */
/* Complement result if negative. */
}
为了在位运算中处理负整数,CPython 使用二进制补码(实际上,这是一个二进制补码,但我不详细介绍)。但请注意“符号规则”(名字是我的):结果的符号是应用于数字符号的按位运算符。更准确地说,如果 nega <op> negb == 1
,结果为负(negx
= 1
为负,0
为正)。 Simplified code:
switch (op) {
case '^': negz = nega ^ negb; break;
case '&': negz = nega & negb; break;
case '|': negz = nega | negb; break;
default: ...
}
另一方面,格式化程序不执行二进制补码,即使是二进制表示:format_long_internal 调用 long_format_binary 并删除两个前导字符,但保留符号。参见 the code:
/* Is a sign character present in the output? If so, remember it
and skip it */
if (PyUnicode_READ_CHAR(tmp, inumeric_chars) == '-') {
sign_char = '-';
++prefix;
++leading_chars_to_skip;
}
long_format_binary
函数不执行任何二进制补码:仅输出以 2 为基数的数字 preceded by the sign。
if (negative) \
*--p = '-'; \
我会按照你的 REPL 序列:
>>> x = -4
>>> print("{} {:b}".format(x, x))
-4 -100
没有什么奇怪的,因为格式中没有二进制补码,而是一个符号。
>>> mask = 0xFFFFFFFF
>>> print("{} {:b}".format(x & mask, x & mask))
4294967292 11111111111111111111111111111100
-4
为负数。因此,它在逻辑与之前被逐位替换为它的二进制补码。您预计结果会变成负数,但请记住“符号规则”:
>>> nega=1; negb=0
>>> nega & negb
0
因此: 1.结果没有负号; 2.结果不补二。你的结果符合“符号规则”,即使这个规则看起来不是很直观。
现在,最后一部分:
>>> x = 0b11111111111111111111111111111100
>>> print("{} {:b}".format(x, x))
4294967292 11111111111111111111111111111100
>>> print("{} {:b}".format(~(x ^ mask), ~(x ^ mask)))
-4 -100
同样, -4
是负数,因此用它的补码 0b11111111111111111111111111111100
代替,然后与 0b11111111111111111111111111111111
异或。结果是 0b11
( 3
)。你取一元补码,又是 0b11111111111111111111111111111100
,但这次符号是负数:
>>> nega=1; negb=0
>>> nega ^ negb
1
因此,如您所料,结果被取反并得到负号。
结论:我想没有完美的解决方案可以让任意长有符号数和提供按位运算,但文档并没有详细说明所做的选择。
关于负整数的 Python 表示,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46993519/
我正在尝试学习 Fortran,并且看到了很多不同的定义,我想知道他们是否正在尝试完成同样的事情。以下有什么区别? 整数*4 整数(4) 整数(kind=4) 最佳答案 在 Fortran >=90
我以前从未编程过,最近(1 周前)才开始学习!第一门类(class)是函数式编程,使用 Haskell。 我有一项学校作业,我想通过删除一两个步骤来改进它,但我遇到了一个讨厌的错误。 基本上,我创建了
给定以下GraphQL请求和变量: 请求: query accounts($filter:AccountFilter, $first_:String, $skip_:Int) { accounts
我已经搜索了 StackOverflow,但找不到关于如何检查计算器应用程序的数字输入正则表达式的答案,该计算器应用程序将检查每个 keyup 的以下格式(jquery key up): 任何整数,例
类似于我上一篇致歉的文章,但没有那么长篇大论。基本上我想知道当每次重绘调用只重绘屏幕的一小部分时,优化重绘到 JFrame/JPanel 的最佳选择是什么。 此外,除了重绘重载之外,我并不是 100%
所以在我的教科书中有一个使用 f# 的递归函数的例子 let rec gcd = function | (0,n) -> n | (m,n) -> gcd(n % m,m);; 使用此功能,我的教科书
我有一个数据结构,例如表达式树或图形。我想添加一些“测量”功能,例如depth和 size . 如何最好地键入这些函数? 我认为以下三个变体的用处大致相同: depth :: Expr -> Int
这样写比较好 int primitive1 = 3, primitive2 = 4; Integer a = new Integer(primitive1); Integer b = new Inte
我是 Java 8 新手,想根据键对 Map 进行排序,然后在值内对每个列表进行排序。 我试图寻找一种 Java 8 方法来对键和值进行排序。HashMap>映射 map.entrySet().str
这就是我的目标... vector ,int> > var_name (x, pair (y),int>); 其中 x 是 vector var_name 的大小,y 是对内 vector 的大小。
这里是 an answer to "How do I instantiate a Queue object in java?" , Queue is an interface. You can't i
这个问题在这里已经有了答案: Weird Integer boxing in Java (12 个答案) Why are autoboxed Integers and .getClass() val
我们可以使用 C++ STL 做这样的事情吗?如果是,我将如何初始化元素?我试图这样做,但没有成功。 pair,vector>p; p.first[0]=2; 最佳答案 Can we do som
您好,我正在尝试为百分比和整数数组中的数字找到索引。假设 arraynum = ['10%','250','20%','500'] 并且用户发送一个值 15%,这个数字在哪个范围内居住?我可以使用这段
我与三列有关系:ProductName、CategoryID 和 Price。我需要选择仅那些价格高于给定类别中平均产品价格的产品。(例如,当apple(ProductName)是fruit(Cate
我已经坚持了一段时间,我正在尝试将一些数据配对在一起。这是我的代码。 #include #include using namespace std; int main() { pair data(
我收到错误:'(Int, Int)' 与 'CGPoint' 不相同 如何将 (Int, Int) 转换为 CGPoint let zigzag = [(100,100), (100,150)
我在 .cpp 文件中发现了以下代码。我不理解涉及头文件的构造或语法。我确实认识到这些特定的头文件与 Android NDK 相关。但是,我认为这个问题是关于 C++ 语法的一般问题。这些在某种程度上
我将这些输入到 Scala 解释器中: val a : Integer = 1; val b : Integer = a + 1; 我收到消息: :5: error: type mismatch;
C++:vector>v(size);当我试图打印出值时显示 0 作为值,但是当未声明 vector 大小时它显示正确的输出?为什么这样?例如: int x; cin>>x; vector>v(x);
我是一名优秀的程序员,十分优秀!