深度辨析Python的eval()与exec()的方法-6ren

深度辨析Python的eval()与exec()的方法

转载作者：qq735679552 更新时间：2022-09-28 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章深度辨析Python的eval()与exec()的方法由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

Python 提供了很多内置的工具函数（Built-in Functions），在最新的 Python 3 官方文档中，它列出了 69 个.

大部分函数是我们经常使用的，例如 print()、open() 与 dir()，而有一些函数虽然不常用，但它们在某些场景下，却能发挥出不一般的作用。内置函数们能够被“提拔”出来，这就意味着它们皆有独到之处，有用武之地.

因此，掌握内置函数的用法，就成了我们应该点亮的技能.

在《Python进阶：如何将字符串常量转为变量？》这篇文章中，我提到过 eval() 和 exec() ，但对它们并不太了解。为了弥补这方面知识，我就重新学习了下。这篇文章是一份超级详细的学习记录，系统、全面而深入地辨析了这两大函数.

1、eval 的基本用法。

语法：eval(expression, globals=None, locals=None) 。

它有三个参数，其中 expression 是一个字符串类型的表达式或代码对象，用于做运算；globals 与 locals 是可选参数，默认值是 None.

具体而言，expression 只能是单个表达式，不支持复杂的代码逻辑，例如赋值操作、循环语句等等。（PS：单个表达式并不意味着“简单无害”，参见下文第 4 节）。

globals 用于指定运行时的全局命名空间，类型是字典，缺省时使用的是当前模块的内置命名空间。locals 指定运行时的局部命名空间，类型是字典，缺省时使用 globals 的值。两者都缺省时，则遵循 eval 函数执行时的作用域。值得注意的是，这两者不代表真正的命名空间，只在运算时起作用，运算后则销毁.

输出结果： a: 30 x: 10 y: 20 b: 3 x: 10 y: 20 c: 4 。

由此可见，当指定了命名空间的时候，变量会在对应命名空间中查找。而且，它们的值不会覆盖实际命名空间中的值.

2、exec 的基本用法。

语法：exec(object[, globals[, locals]]) 。

在 Python2 中 exec 是个语句，而 Python3 将其改造成一个函数，就像 print 一样。exec() 与 eval() 高度相似，三个参数的意义和作用相近.

主要的区别是，exec() 的第一个参数不是表达式，而是代码块，这意味着两点：一是它不能做表达式求值并返回出去，二是它可以执行复杂的代码逻辑，相对而言功能更加强大，例如，当代码块中赋值了新的变量时，该变量可能在函数外的命名空间中存活下来.

 
    ? 
   
         >>> x  
         = 
         1 
        
         >>> y  
         = 
         exec 
         ( 
         'x = 1 + 1' 
         ) 
        
         >>>  
         print 
         (x) 
        
         >>>  
         print 
         (y) 
        
         2 
        
         None

可以看出，exec() 内外的命名空间是相通的，变量由此传递出去，而不像 eval() 函数，需要一个变量来接收函数的执行结果.

3、一些细节辨析。

两个函数都很强大，它们将字符串内容当做有效的代码执行。这是一种字符串驱动的事件，意义重大。然而，在实际使用过程中，存在很多微小的细节，此处就列出我所知道的几点吧.

常见用途：将字符串转成相应的对象，例如 string 转成 list ，string 转成 dict，string 转 tuple 等等.

 
    ? 
   
 
     
       
       
         >>> a  
         = 
         "[[1,2], [3,4], [5,6], [7,8], [9,0]]" 
        
 
         >>>  
         print 
         ( 
         eval 
         (a)) 
        
 
         [[ 
         1 
         ,  
         2 
         ], [ 
         3 
         ,  
         4 
         ], [ 
         5 
         ,  
         6 
         ], [ 
         7 
         ,  
         8 
         ], [ 
         9 
         ,  
         0 
         ]] 
        
 
         >>> a  
         = 
         "{'name': 'Python猫', 'age': 18}" 
        
 
         >>>  
         print 
         ( 
         eval 
         (a)) 
        
 
         { 
         'name' 
         :  
         'Python猫' 
         ,  
         'age' 
         :  
         18 
         } 
        

            
        
 
         # 与 eval 略有不同 
        
 
         >>> a  
         = 
         "my_dict = {'name': 'Python猫', 'age': 18}" 
        
 
         >>>  
         exec 
         (a) 
        
 
         >>>  
         print 
         (my_dict) 
        
 
         { 
         'name' 
         :  
         'Python猫' 
         ,  
         'age' 
         :  
         18 
         } 
        
 
     
 
   

eval() 函数的返回值是其 expression 的执行结果，在某些情况下，它会是 None，例如当该表达式是 print() 语句，或者是列表的 append() 操作时，这类操作的结果是 None，因此 eval() 的返回值也会是 None.

 
    ? 
   
         >>> result  
         = 
         eval 
         ( 
         '[].append(2)' 
         ) 
        
         >>>  
         print 
         (result) 
        
         None

exec() 函数的返回值只会是 None，与执行语句的结果无关，所以，将 exec() 函数赋值出去，就没有任何必要。所执行的语句中，如果包含 return 或 yield ，它们产生的值也无法在 exec 函数的外部起作用.

 
    ? 
   
         >>> result  
         = 
         exec 
         ( 
         '1 + 1' 
         ) 
        
         >>>  
         print 
         (result) 
        
         None

两个函数中的 globals 和 locals 参数，起到的是白名单的作用，通过限定命名空间的范围，防止作用域内的数据被滥用.

conpile() 函数编译后的 code 对象，可作为 eval 和 exec 的第一个参数。compile() 也是个神奇的函数，我翻译的上一篇文章《Python骚操作：动态定义函数》就演示了一个动态定义函数的操作.

吊诡的局部命名空间：前面讲到了 exec() 函数内的变量是可以改变原有命名空间的，然而也有例外.

 
    ? 
   
         def 
         foo(): 
        
         exec 
         ( 
         'y = 1 + 1\nprint(y)' 
         ) 
        
         print 
         ( 
         locals 
         ()) 
        
         print 
         (y) 
        
         foo()

按照前面的理解，预期的结果是局部变量中会存入变量 y，因此两次的打印结果都会是 2，然而实际上的结果却是:

2 {'y': 2} Traceback (most recent call last): ...(略去部分报错信息) print(y) NameError: name 'y' is not defined 。

明明看到了局部命名空间中有变量 y，为何会报错说它未定义呢?

原因与 Python 的编译器有关，对于以上代码，编译器会先将 foo 函数解析成一个 ast（抽象语法树），然后将所有变量节点存入栈中，此时 exec() 的参数只是一个字符串，整个就是常量，并没有作为代码执行，因此 y 还不存在。直到解析第二个 print() 时，此时第一次出现变量 y ，但因为没有完整的定义，所以 y 不会被存入局部命名空间.

在运行期，exec() 函数动态地创建了局部变量 y ，然而由于 Python 的实现机制是“运行期的局部命名空间不可改变 ”，也就是说这时的 y 始终无法成为局部命名空间的一员，当执行 print() 时也就报错了.

至于为什么 locals() 取出的结果有 y，为什么它不能代表真正的局部命名空间？为什么局部命名空间无法被动态修改？可以查看我之前分享的《Python 动态赋值的陷阱》，另外，官方的 bug 网站中也有对此问题的讨论，查看地址：https://bugs.python.org/issue4831 。

若想把 exec() 执行后的 y 取出来的话，可以这样：z = locals()['y'] ，然而如果不小心写成了下面的代码，则会报错:

 
    ? 
   
         def 
         foo(): 
        
         exec 
         ( 
         'y = 1 + 1' 
         ) 
        
         y  
         = 
         locals 
         ()[ 
         'y' 
         ] 
        
         print 
         (y) 
        
         foo() 
        
         #报错：KeyError: 'y' 
        
         #把变量 y 改为其它变量则不会报错

KeyError 指的是在字典中不存在对应的 key 。本例中 y 作了声明，却因为循环引用而无法完成赋值，即 key 值对应的 value 是个无效值，因此读取不到，就报错了.

此例还有 4 个变种，我想用一套自恰的说法来解释它们，但尝试了很久，未果。留个后话吧，等我想明白，再单独写一篇文章.

4、为什么要慎用 eval() ?

很多动态的编程语言中都会有 eval() 函数，作用大同小异，但是，无一例外，人们会告诉你说，避免使用它.

为什么要慎用 eval() 呢？主要出于安全考虑，对于不可信的数据源，eval 函数很可能会招来代码注入的问题.

 
    ? 
   
         >>>  
         eval 
         ( 
         "__import__('os').system('whoami')" 
         ) 
        
         desktop 
         - 
         fa4b888\pythoncat 
        
         >>>  
         eval 
         ( 
         "__import__('subprocess').getoutput('ls ~')" 
         ) 
        
         #结果略，内容是当前路径的文件信息

在以上例子中，我的隐私数据就被暴露了。而更可怕的是，如果将命令改为rm -rf ~ ，那当前目录的所有文件都会被删除干净.

针对以上例子，有一个限制的办法，即指定 globals 为 {'__builtins__': None} 或者 {'__builtins__': {}} .

 
    ? 
   
         >>> s  
         = 
         { 
         '__builtins__' 
         :  
         None 
         } 
        
         >>>  
         eval 
         ( 
         "__import__('os').system('whoami')" 
         , s) 
        
         #报错：TypeError: 'NoneType' object is not subscriptable

__builtins__ 包含了内置命名空间中的名称，在控制台中输入 dir(__builtins__) ，就能发现很多内置函数、异常和其它属性的名称。在默认情况下，eval 函数的 globals 参数会隐式地携带__builtins__ ，即使是令 globals 参数为 {} 也如此，所以如果想要禁用它，就得显式地指定它的值.

上例将它映射成 None，就意味着限定了 eval 可用的内置命名空间为 None，从而限制了表达式调用内置模块或属性的能力.

但是，这个办法还不是万无一失的，因为仍有手段可以发起攻击.

某位漏洞挖掘高手在他的博客中分享了一个思路，令人大开眼界。其核心的代码是下面这句，你可以试试执行，看看输出的是什么内容.

 
    ? 
   
         >>> ().__class__.__bases__[ 
         0 
         ].__subclasses__()

关于这句代码的解释，以及更进一步的利用手段，详见博客。（地址：http://www.zzvips.com/article/169637.html）。

另外还有一篇博客，不仅提到了上例的手段，还提供了一种新的思路:

 
    ? 
   
         #警告：千万不要执行如下代码，后果自负。 
        
         >>>  
         eval 
         ( 
         '(lambda fc=(lambda n: [c 1="c" 2="in" 3="().__class__.__bases__[0" language="for"][/c].__subclasses__() if c.__name__ == n][0]):fc("function")(fc("code")(0,0,0,0,"KABOOM",(),(),(),"","",0,""),{})())()' 
         , {"__builtins__": 
         None 
         })

这行代码会导致 Python 直接 crash 掉。具体分析在：http://www.zzvips.com/article/169638.html 。

除了黑客的手段，简单的内容也能发起攻击。像下例这样的写法，将在短时间内耗尽服务器的计算资源.

 
    ? 
   
         >>>  
         eval 
         ( 
         "2 ** 888888888" 
         , { 
         "__builtins__" 
         : 
         None 
         }, {})

如上所述，我们直观地展示了 eval() 函数的危害性，然而，即使是 Python 高手们小心谨慎地使用，也不能保证不出错.

在官方的 dumbdbm 模块中，曾经（2014年）发现一个安全漏洞，攻击者通过伪造数据库文件，可以在调用 eval() 时发起攻击。（详情：https://bugs.python.org/issue22885）。

无独有偶，在上个月（2019.02），有核心开发者针对 Python 3.8 也提出了一个安全问题，提议不在 logging.config 中使用 eval() 函数，目前该问题还是 open 状态。（详情：https://bugs.python.org/issue36022）。

如此种种，足以说明为什么要慎用 eval() 了。同理可证，exec() 函数也得谨慎使用.

5、安全的替代用法。

既然有种种安全隐患，为什么要创造出这两个内置方法呢？为什么要使用它们呢?

理由很简单，因为 Python 是一门灵活的动态语言。与静态语言不同，动态语言支持动态地产生代码，对于已经部署好的工程，也可以只做很小的局部修改，就实现 bug 修复.

那有什么办法可以相对安全地使用它们呢?

ast 模块的 literal() 是 eval() 的安全替代，与 eval() 不做检查就执行的方式不同，ast.literal() 会先检查表达式内容是否有效合法。它所允许的字面内容如下:

strings, bytes, numbers, tuples, lists, dicts, sets, booleans, 和 None 。

一旦内容非法，则会报错:

 
    ? 
   
         import 
         ast 
        
         ast.literal_eval( 
         "__import__('os').system('whoami')" 
         )

报错：ValueError: malformed node or string 。

不过，它也有缺点：AST 编译器的栈深（stack depth）有限，解析的字符串内容太多或太复杂时，可能导致程序崩溃.

至于 exec() ，似乎还没有类似的替代方法，毕竟它本身可支持的内容是更加复杂多样的.

最后是一个建议：搞清楚它们的区别与运行细节（例如前面的局部命名空间内容），谨慎使用，限制可用的命名空间，对数据源作充分校验.

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我.

原文链接：http://www.cnblogs.com/pythonista/p/10590682.html 。

最后此篇关于深度辨析Python的eval()与exec()的方法的文章就讲到这里了,如果你想了解更多关于深度辨析Python的eval()与exec()的方法的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐： Python实现的矩阵转置与矩阵相乘运算示例

文章推荐：基于Netty的代理网关设计与实现

文章推荐： C++迷宫问题的求解算法

文章推荐： HarmonyOS ArkUI之自定义组件侧滑菜单（JS）

python - Python 中的集群或合并集群以减少组数 (Python)
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库，但没有成功。我猜它只是通过 knn 聚类
python - python 列表的子集基于同一列表的元素组，pythonically
我有一个扁平数字列表，这些数字逻辑上以 3 为一组，其中每个三元组是 (number, __ignored, flag[0 or 1])，例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
python - 激活 Python 虚拟环境并在另一个 Python 脚本中调用 Python 脚本
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
python - 在焕然一新的 Python 环境中以编程方式从 Python 内部执行 Python 文件
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
python - 从 python 脚本但在 python 脚本之外运行 python 脚本
这听起来像是谜语或笑话，但实际上我还没有找到这个问题的答案。问题到底是什么？我想运行 2 个脚本。在第一个脚本中，我调用另一个脚本，但我希望它们继续并行，而不是在两个单独的线程中。主要是我不希望第
python - 使用不同的 python 从 python 运行 python 脚本
我有一个带有 python 2.5.5 的软件。我想发送一个命令，该命令将在 python 2.7.5 中启动一个脚本，然后继续执行该脚本。我试过用 #!python2.7.5 和http://re
python - 为什么从 Python 命令行调用 Python 时 Python 无法找到并运行我的脚本？
我在 python 命令行(使用 python 2.7)中，并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹，使用: os.chdir("
python - 使用动态版本的 Python 执行嵌入的 Python 代码时出现致命的 Python 错误
剧透:部分解决(见最后)。以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
python - python 中识别 python 数组或列表中最大累积差异的最快方法是什么？
假设我有以下列表，对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
python - (Python) 通过单选按钮 python 更新背景
所以我试图在选择某个单选按钮时更改此框架的背景。我的框架位于一个类中，并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
python - python 中的字符串与正则表达式比较在 python 中失败
我正在尝试将字符串与 python 中的正则表达式进行比较，如下所示， #!/usr/bin/env python3 import re str1 = "Expecting property name
python - python 如何加载Boost.Python 库？
考虑以下原型(prototype) Boost.Python 模块，该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
python - python 检查模块 python 的问题
如何编写一个程序来“识别函数调用的行号？” python 检查模块提供了定位行号的选项，但是， def di(): return inspect.currentframe().f_back.f_l
python - 系统 python 与用户 python
我已经使用 macports 安装了 Python 2.7，并且由于我的 $PATH 变量，这就是我输入 $ python 时得到的变量。然而，virtualenv 默认使用 Python 2.6，除
python - [Python] : Python re. 长字符串行的搜索速度优化
我只想问如何加快 python 上的 re.search 速度。我有一个很长的字符串行，长度为 176861(即带有一些符号的字母数字字符)，我使用此函数测试了该行以进行研究: def getExe
python - 编辑字符串 python 正则表达式 python
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
python - Python 映射中的副作用(Python "do" block )
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。告
python - 使用其值逻辑组合两个 python 列表 - Python
我想用 Python 将两个列表组合成一个列表，方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
python - Boost.Python python 链接错误
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
python - 在 Python 中仅使用内置库制作一个基本的网络抓取工具 - Python
学习 Python，我正在尝试制作一个没有任何第 3 方库的网络抓取工具，这样过程对我来说并没有简化，而且我知道我在做什么。我浏览了一些在线资源，但所有这些都让我对某些事情感到困惑。 html 看起来

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

深度辨析Python的eval()与exec()的方法