Python 内部是如何实现整数相加不溢出的？-6ren

Python 内部是如何实现整数相加不溢出的？

转载作者：qq735679552 更新时间：2022-09-29 22:32:09

25

4

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Python 内部是如何实现整数相加不溢出的？由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

1、如何表示一个整数

Python 内部是如何实现整数相加不溢出的？

要想了解这个，那就需要看 Python 的源代码[1]，Python中的整数底层对应的结构体是PyLongObject，它位于 longobject.h[2] 中.

Python 内部是如何实现整数相加不溢出的？

逐步展开如下:

//longobject.h
typedef struct _longobject PyLongObject; /* Revealed in longintrepr.h */
//longintrepr.h
struct _longobject {
PyObject_VAR_HEAD
digit ob_digit[1];
};
//合起来可以看成
typedef struct {
PyObject_VAR_HEAD
digit ob_digit[1];
} PyLongObject;

再把宏定义 PyObject_VAR_HEAD 展开:

typedef struct {
PyObject_HEAD
int ob_size;
digit ob_digit[1];
} PyLongObject;

再把宏定义 PyObject_HEAD 展开，结构体中的变量我已经作了注释:

typedef struct {
int ob_refcnt; //引用计数
struct _typeobject *ob_type; //变量类型
int ob_size; //用来指明变长对象中一共容纳了多少个元素
digit ob_digit[1]; //digit类型的数组,长度为1
} PyLongObject;

这里面的 ob_size 用来指明变长对象中一共容纳了多少个元素，也就是 ob_digit 数组的长度，而这个 ob_digit 数组显然只能是用来维护具体的值.

到这里已经很明显了，Python 将大整数切割后存在 ob_digit，这个数组的长度是可变的，数据越大，数组越长，只要内存够用，存多大的数都可以.

那么下面的重点就在这个 ob_digit 数组了，我们看看 Python 中整数对应的值，比如 256，是怎么放在这个数组里面的。不过首先我们要看看这个digit 是个什么类型，它同样定义在 longintrepr.h 中。

#if PYLONG_BITS_IN_DIGIT == 30
typedef uint32_t digit;
// ...
#elif PYLONG_BITS_IN_DIGIT == 15
typedef unsigned short digit;
// ...
#endif

PYLONG_BITS_IN_DIGIT 是一个宏，如果你的机器是 64 位的，那么它会被定义为 30，32 位机器则会被定义为 15.

而我们的机器现在基本上都是 64 位的，所以 PYLONG_BITS_IN_DIGIT会等于 30，因为 digit 等价于 uint32_t(unsigned int)，所以它是一个无符号 32 位整型.

所以 ob_digit 这个数组是一个无符号 32 位整型数组，长度为 1。当然这个数组具体多长则取决于你要存储的 Python 整数有多大，因为 C 中数组的长度不属于类型信息，你可以看成是长度 n，而这个 n 是多少要取决于你的整数大小。显然整数越大，这个数组就越长，那么占用空间就越大.

为了说明 256 是如何存放在 ob_digit 里的，我们来简化下，这里假如 ob_digit 这个数组是一个无符号 8 位整型数组，8 位二进制，最大只能表示 255，我们要表示 256，那就只能再申请一个 8 位，也许你认为再申请一个 8 位来表示 1，其实不是的，是使用一个新的 8 位整数来模拟更高的位，如下所示:

255 = [255]
256 = [1,1]

256 = [1,1] 的形式也不是真实情况，为了你理解，先这样写，它表达的意思就是 256 = 1 + 1 * (2^8 - 1) = 1 + 1 * 255 = 256.

也就是说 ob_digit 表示 x 进制数，ob_digit[0] 是低位，ob_digit[1] 是高位，具体 x 是多少，取决于 ob_digit 的类型，这里 8 位，就是 255 进制.

刚才提到 256 = [1,1] 的形式也不是真实情况，因为 PyLongObject 不仅仅是为了存储大整数，也需要参与运算，具体怎么运算呢，那就是 ob_digit 逐位相加即可.

既然是相加，即又可能溢出，比如 [255 , 1] + [255, 1] = [510,2] 。

这里的 510 就超出了 8 位，为了简化处理，只要我们不用满 8 位，就不会溢出，也就是说，比如说只用 7 位，那最大也就是 [127,...] + [127,...] = [254,...] 也就不会溢出了.

到这里，你会明白，为什么 digit 虽然是无符号 32 位整数，却只使用 30 位了吧:

#if PYLONG_BITS_IN_DIGIT == 30
typedef uint32_t digit;
// ...
#elif PYLONG_BITS_IN_DIGIT == 15
typedef unsigned short digit;
// ...
#endif

聪明的你，可能会问，31 位就可以保证不溢出，为啥牺牲两位，用 30 位，答案我也不知道，可能是因为 64 是 32 的两倍， 30 也是 15 的两倍，这样看起来更舒服吧.

那如何表示负数呢，其实负数的话，就是 ob_size 变成了负的，其他没变。整数的正负号是通过这里的 ob_size 决定的。ob_digit 存储的其实是绝对值，无论 n 取多少，-n 和 n 对应的 ob_digit 是完全一致的，但是ob_size 则互为相反数。所以 ob_size 除了表示数组的长度之外，还可以表示对应整数的正负.

所以 Python 在比较两个整型的大小时，会先比较 ob_size，如果 ob_size 不一样则可以直接比较出大小来.

总结一下，就是当 PYLONG_BITS_IN_DIGIT == 30 的时候，整数 = ob_digit[0] + ob_digit[1] * 2 ** 30 + ob_digit[2] * 2 ** 60 + ... 。

2、整数占用内存大小

理解了这一点，我们再看一下这个结构体:

typedef struct {
int ob_refcnt; //引用计数
struct _typeobject *ob_type; //变量类型
int ob_size; //用来指明变长对象中一共容纳了多少个元素
digit ob_digit[1]; //digit类型的数组,长度为1
} PyLongObject;

一个整数占用多少个字节，取决于 PyLongObject 这个结构体占用多少字节，ob_refcnt、ob_type、ob_size 这三个是整数所必备的，它们都是 8 字节，加起来 24 字节。所以任何一个整数所占内存都至少 24 字节，至于具体占多少，则取决于 ob_digit 里面的元素都多少个.

现在的你不难理解以下结果:

Python 内部是如何实现整数相加不溢出的？

3、整数池

此外 Python 中的整数属于不可变对象，运算之后会创建新的对象

>>> a = 300
>>> id(a)
140220663619152
>>> a += 1
>>> id(a)
140220663619408
>>>

这样就势必会有性能缺陷，因为程序运行时会有对象的创建和销毁，就是涉及内存的申请和垃圾回收，一个常用的手段就是使用对象池，将频率高的整数预先创建好，而且都是单例模式，需要使用时直接返回.

小整数对象池的实现位于 pycore_interp.h[3] 中:

Python 内部是如何实现整数相加不溢出的？

验证一下:

>>> a = -6
>>> b = -6
>>> a is b
False
>>> a = -5
>>> b = -5
>>> a is b
True
>>> a = 256
>>> b = 256
>>> a is b
True
>>> a = 257
>>> b = 257
>>> a is b
False
>>>

不同的版本可能会不同，我这里 Python3.8，区间为 [-5,257).

4、整数加减法

有了前面的铺垫，现在我们来看下 Python 中大整数是如何相加的，源代码 longobject.c : long_add 函数[4] 。

Python 内部是如何实现整数相加不溢出的？

可以看到 long_add 根据 ob_size 的正或负来调用 x_add 或 x_sub.

现在看一下 x_add 的源代码:

Python 内部是如何实现整数相加不溢出的？

可以看到，Python 大整数的相加就是底层数组的相加，当然还会涉及到进位等操作:

for (i = 0; i < size_b; ++i) {
carry += a->ob_digit[i] + b->ob_digit[i];
z->ob_digit[i] = carry & PyLong_MASK;
carry >>= PyLong_SHIFT;
}

x_sub 的源代码:

Python 内部是如何实现整数相加不溢出的？

4、整数乘法

Python 整数乘法使用的是 Karatsuba multiplication[5] 算法进行的大数乘法，感兴趣的可以研究一下.

最后的话

源码之下无秘密，看源码会比较辛苦，却可以学到精髓和本质，本文通过源码逐层展开，带你了解了下 Python 整数对象的实现、整数内存大小的计算，整数池，整数加减法源码，相信你已经知道了 Python 是如何实现整数想加而不溢出的。如果有收获，还请点在、点赞、转发，感谢一路的支持和陪伴.

原文链接：https://mp.weixin.qq.com/s?__biz=MzU0OTg3NzU2NA==&mid=2247487960&idx=1&sn=9be99d54fb47fdd2f6fc6f8b9c37e3f7&chksm=fba8738bccdffa9dafbcc0055c0079fe1b1a50622d0607fee183fc00d1a68abb99e1db4e943f&mpshare=1& 。

最后此篇关于Python 内部是如何实现整数相加不溢出的？的文章就讲到这里了,如果你想了解更多关于Python 内部是如何实现整数相加不溢出的？的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

25

4

0

文章推荐： python中的列表和元组区别分析

文章推荐：利用python实现对web服务器的目录探测的方法

文章推荐：浅谈分词器Tokenizer

文章推荐： python selenium 弹出框处理的实现

Fortran:整数*4 vs 整数(4) vs 整数(kind=4)
我正在尝试学习 Fortran，并且看到了很多不同的定义，我想知道他们是否正在尝试完成同样的事情。以下有什么区别？整数*4 整数(4) 整数(kind=4) 最佳答案在 Fortran >=90
list - 转换 [整数] -> 整数
我以前从未编程过，最近(1 周前)才开始学习!第一门类(class)是函数式编程，使用 Haskell。我有一项学校作业，我想通过删除一两个步骤来改进它，但我遇到了一个讨厌的错误。基本上，我创建了
graphql - 变量和参数的类型不匹配(整数/整数)
给定以下GraphQL请求和变量: 请求: query accounts($filter:AccountFilter, $first_:String, $skip_:Int) { accounts
javascript - 整数、整数+点和小数的正则表达式
我已经搜索了 StackOverflow，但找不到关于如何检查计算器应用程序的数字输入正则表达式的答案，该计算器应用程序将检查每个 keyup 的以下格式(jquery key up): 任何整数，例
Java 图形 : setClip vs clipRect vs repaint(int, 整数、整数、整数)
类似于我上一篇致歉的文章，但没有那么长篇大论。基本上我想知道当每次重绘调用只重绘屏幕的一小部分时，优化重绘到 JFrame/JPanel 的最佳选择是什么。此外，除了重绘重载之外，我并不是 100%
math - F#:整数 (%) 整数 - 是如何计算的？
所以在我的教科书中有一个使用 f# 的递归函数的例子 let rec gcd = function | (0,n) -> n | (m,n) -> gcd(n % m,m);; 使用此功能，我的教科书
haskell - 给测量数据结构的函数赋予什么类型？整数，整数，积分？
我有一个数据结构，例如表达式树或图形。我想添加一些“测量”功能，例如depth和 size . 如何最好地键入这些函数？我认为以下三个变体的用处大致相同: depth :: Expr -> Int
java - compareTo 与原语 -> 整数/整数
这样写比较好 int primitive1 = 3, primitive2 = 4; Integer a = new Integer(primitive1); Integer b = new Inte
Java 8 HashMap<整数, ArrayList<整数>>
我是 Java 8 新手，想根据键对 Map 进行排序，然后在值内对每个列表进行排序。我试图寻找一种 Java 8 方法来对键和值进行排序。HashMap>映射 map.entrySet().str
C++: vector <对< vector <整数>，整数>>
这就是我的目标... vector ,int> > var_name (x, pair (y),int>); 其中 x 是 vector var_name 的大小，y 是对内 vector 的大小。
java - 队列<整数> q = new LinkedList<整数>()
这里是 an answer to "How do I instantiate a Queue object in java?" , Queue is an interface. You can't i
java - 整数 i=3 vs 整数 i= 新整数 (3)
这个问题在这里已经有了答案: Weird Integer boxing in Java (12 个答案) Why are autoboxed Integers and .getClass() val
C++: 对< vector <整数>, vector <整数>> p;
我们可以使用 C++ STL 做这样的事情吗？如果是，我将如何初始化元素？我试图这样做，但没有成功。 pair,vector>p; p.first[0]=2; 最佳答案 Can we do som
javascript - 基于值(整数，字符串)或(整数， float )的混合返回数组的索引
您好，我正在尝试为百分比和整数数组中的数字找到索引。假设 arraynum = ['10%','250','20%','500'] 并且用户发送一个值 15%，这个数字在哪个范围内居住？我可以使用这段
mysql - 将 AVG(整数) 与类别的 AVG(整数) 进行比较
我与三列有关系:ProductName、CategoryID 和 Price。我需要选择仅那些价格高于给定类别中平均产品价格的产品。(例如，当apple(ProductName)是fruit(Cate
c++ - 如何打印对的第二部分？ EX : pair>
我已经坚持了一段时间，我正在尝试将一些数据配对在一起。这是我的代码。 #include #include using namespace std; int main() { pair data(
swift - '(整数，整数 )' is not identical to ' CGPoint'
我收到错误:'(Int, Int)' 与 'CGPoint' 不相同如何将 (Int, Int) 转换为 CGPoint let zigzag = [(100,100), (100,150)
c++ - 这是什么 C++ 语言构造 : # (i. e。哈希)整数 "path_to_header_or_cpp_file"<整数>？
我在 .cpp 文件中发现了以下代码。我不理解涉及头文件的构造或语法。我确实认识到这些特定的头文件与 Android NDK 相关。但是，我认为这个问题是关于 C++ 语法的一般问题。这些在某种程度上
scala - 整数 vs 整数 : type mismatch, 找到 : Int, 需要:字符串
我将这些输入到 Scala 解释器中: val a : Integer = 1; val b : Integer = a + 1; 我收到消息: :5: error: type mismatch;
c++ - vector <对<整数，整数>>v(大小)；打印时显示 0 作为值
C++:vector>v(size);当我试图打印出值时显示 0 作为值，但是当未声明 vector 大小时它显示正确的输出？为什么这样？例如: int x; cin>>x; vector>v(x);

首页

博学

6Ren·AI

商城