python - 为什么我不想立即将所有可迭代对象转换为具有定义长度的内容(例如列表)？-6ren

python - 为什么我不想立即将所有可迭代对象转换为具有定义长度的内容(例如列表)？

转载作者：行者123 更新时间：2023-12-03 22:28:46

25

4

关闭。这个问题是opinion-based .它目前不接受答案。

想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题.

7 个月前关闭。

Improve this question

我不确定为什么我不会总是转换为列表。为什么我不想立即将所有可迭代对象转换为具有定义长度的内容(例如列表)？

最佳答案

欢迎来到社区!

“将可迭代对象转换为列表”通常是 O(N)/线性运算

“处理列表中的所有元素”通常是 O(N)/线性运算

在对其进行处理之前，通常不应将可迭代对象转换为列表的原因是因为它会执行 2 * N为应该只需要的东西工作 N操作。
(正如一些用户在评论中提到的那样，这里有一些关于 Big-O 复杂性的严重滥用符号。对于时间复杂度界限，我们忽略常量，而是关注与极限中的类似算法相比的行为。这里我们将专注于一个特定案例，并对其中一些在实践中的表现进行基准测试。)

以下是我们感兴趣的两个案例:

def compute_over_iterable():
    """Initialize `values` as an iterable, and do computation over it."""
    values = range(10000)
    result = []
    for entry in values:
        result.append(entry + 1)
    return result

def compute_over_iterable_to_list():
    """Initialize `values` as an iterable, cast to a list, then compute:"""
    values = list(range(10000))
    result = []
    for entry in values:
        result.append(entry + 1)
    return result

与 pytest-benchmark ，我们可以看到这些案例的表现:

----------------------------------- benchmark: 2 tests -----------------------------------
Name (time in us)                Min                   Max                  Mean          
------------------------------------------------------------------------------------------
test_iterable               781.3790 (1.0)      1,118.6880 (1.0)        837.1683 (1.0)    
test_iterable_to_list     1,000.4090 (1.28)     1,524.6950 (1.36)     1,138.6464 (1.36)   
------------------------------------------------------------------------------------------

在这种情况下，我们看到情况 (2)，其中我们将可迭代对象转换为列表所花费的时间比直接使用可迭代对象长约 1.36 倍。
自 list(range(10000)) 以来，这两个结果都相当接近cast 在 Python 的底层 C 实现中处理。如果您完全在 Python 中执行此操作，则差异会更加明显:

def compute_over_iterable_list_comprehension():
    values = range(10000)
    values_cast = [i for i in values]
    result = []
    for entry in values_cast:
        result.append(entry + 1)
    return result

我们看到它花费的时间是直接使用可迭代对象的大约 1.5 倍:

------------------------------------------ benchmark: 3 tests ------------------------------------------
Name (time in us)                              Min                   Max                  Mean          
--------------------------------------------------------------------------------------------------------
test_iterable                             844.9320 (1.0)      1,014.3210 (1.0)        896.8944 (1.0)    
test_iterable_to_list                   1,079.2420 (1.28)     1,370.0570 (1.35)     1,140.3908 (1.27)   
test_iterable_to_list_comprehension     1,269.8290 (1.50)     1,662.9790 (1.64)     1,336.5758 (1.49)   
--------------------------------------------------------------------------------------------------------

一些异常(exception)和有趣的案例 MemoryView'@user2357112 支持莫妮卡' shared an interesting case in the comments我不熟悉的。它涉及 MemoryViews :

"This usually requires an object with a means of converting it to a list other than just calling list on it. It still wastes memory and usually doesn't save much time, so it's usually not worth bothering."

出于好奇，我将这些添加到单独的基准测试中。以下是重点介绍三种情况的基本概述:

def compute_over_memory_view():
    values = memoryview(b'x' * 10000)
    # ...

def compute_over_memory_view_tolist():
    values = memoryview(b'x' * 10000)
    for entry in values.tolist():
    # ...

def compute_over_memory_view_cast():
    values = memoryview(b'x' * 10000)
    values_cast = list(values)
    # ...

我的基准测试似乎表明调用 tolist memoryview 对象上的方法与直接在 memoryview 上操作几乎没有区别，但相比之下，转换为列表( list(values) )要慢得多。

-------------------------- benchmark 'Memory Views': 3 tests ---------------------------
Name (time in us)                Min                Mean                   Max          
----------------------------------------------------------------------------------------
test_memory_view            711.5030 (1.0)      774.2104 (1.0)        990.5890 (1.0)    
test_memory_view_tolist     745.4060 (1.05)     822.1782 (1.06)     1,154.2550 (1.17)   
test_memory_view_cast       860.5850 (1.21)     995.6708 (1.29)     1,290.4440 (1.30)   
----------------------------------------------------------------------------------------

无限长度的可迭代对象
'@Tomerikoo' 提出了另一个好观点:可迭代对象可以是无限的。在这种情况下，尝试将可迭代对象转换为有限长度的对象可能会使您陷入无限循环。
这是一个显示这一点的最小示例:

>>> from itertools import cycle
>>> from time import sleep
>>> for i in cycle(range(3)):
...   sleep(0.5)
...   print(i)
... 
0
1
2
0
1
2
0

我们已经论证过“将可迭代对象转换为列表”是一种可能需要遍历列表中所有元素的操作。
因此，以下语句是一个无限循环:

>>> list(cycle(range(3))

关于python - 为什么我不想立即将所有可迭代对象转换为具有定义长度的内容(例如列表)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67064386/

25

4

0

文章推荐： express - 使用关联将 model.update 序列化

文章推荐： postgresql - 在 Sequelize 中为 Postgres 使用事务

文章推荐： c# - 如何在命令运行时从 C# 中的 powershell 获取输出？

文章推荐： javascript - 如何使用jQuery获得 parent parent child 的值(value)？

java - float(具有 4 个字节的内存)可以在 Java 中保存 long(具有 8 个字节的内存)值。如何？
这是代码片段。请说出这种用小内存存储大数据的算法是什么。 public static void main(String[] args) { long longValue = 21474836
php - 当 Gmail IMAP 具有 utf8 而 Outlook 具有 ISO-8859-7 时，如何读取内容类型 header 并将其转换为 utf-8？
所以我使用 imap 从 gmail 和 outlook 接收电子邮件。 Gmail 像这样编码 =?UTF-8?B?UmU6IM69zq3OvyDOtc68zrHOuc67IG5ldyBlbWFpb
具有 2 个参数的计划过程
很久以前就学会了 C 代码；想用 Scheme 尝试一些新的和不同的东西。我正在尝试制作一个接受两个参数并返回两者中较大者的过程，例如 (define (larger x y) (if (> x
azure - 具有/不具有跨区域恢复的异地冗余恢复服务保管库有什么意义？
Azure 恢复服务保管库有两个备份配置选项 - LRS 与 GRS 这是一个有关 Azure 恢复服务保管库的问题。当其驻留区域发生故障时，如何处理启用异地冗余的恢复服务保管库？如果未为恢复服务启
hibernate - 具有@OneToMany属性的可嵌入实体
说，我有以下实体： @Entity public class A { @Id @GeneratedValue private Long id; @Embedded private
java - 具有 "in"运算符和空列表的条件
我有下一个问题。我有下一个标准: criteria.add(Restrictions.in("entity.otherEntity", getOtherEntitiesList())); 如果我的
Java - 具有 If 语句打印顺序错误的主方法
如果这是任何类型的重复，我会提前申请，但我找不到任何可以解决我的具体问题的内容。这是我的程序: import java.util.Random; public class CarnivalGame{
database - 具有$ setIntersection的Mongodb聚合管道
我目前正在使用golang创建一个聚合管道，在其中使用“$ or”运算符查询文档。结果是一堆需要分组的未分组文档，这样我就可以进入下一阶段，找到两个数据集之间的交集。然后将其用于在单独的集合中进行
java - 具有 Or 条件的正则表达式？
是否可以在正则表达式中创建 OR 条件。我正在尝试查找包含此类模式的文件名列表的匹配项第一个案例 xxxxx-hello.file 或者案例二 xxxx-hello-unasigned.file
c - 具有 `for` 循环的菱形输出
该程序只是在用户输入行数时创建菱形的形状，因此它有 6 个 for 循环； 3 个循环创建第一个三角形，3 个循环创建另一个三角形，通过这 2 个三角形和 6 个循环，我们得到了一个菱形，这是整个程序
c# - 具有 "&"的查询字符串值
我有一个像这样的查询字符串 www.google.com?Department=Education & Finance&Department=Health 我有这些 li 标签，它们的查询字符串是这样
c# - 具有/不同配置值的单元测试静态构造函数
我有一个带有静态构造函数的类，我用它来读取 app.config 值。如何使用不同的配置值对类进行单元测试。我正在考虑在不同的应用程序域中运行每个测试，这样我就可以为每个测试执行静态构造函数 - 但我
c++ - 具有 OR 搜索功能的多键容器
我正在寻找一个可以容纳多个键的容器，如果我为其中一个键值输入保留值(例如 0)，它会被视为“或”搜索。 map, int > myContainer; myContainer.insert(make_
mysql - 具有/多种类型的单个对象的关系表设计
我正在为 Web 应用程序创建数据库，并正在寻找一些建议来对可能具有多种类型的单个实体进行建模，每种类型具有不同的属性。作为示例，假设我想为“数据源”对象创建一个关系模型。所有数据源都会有一些共享属
arrays - 具有 IN 条件的存储过程语法
(1) =>CREATE TABLE T1(id BIGSERIAL PRIMARY KEY, name TEXT); CREATE TABLE (2) =>INSERT INTO T1 (name)
sql - 具有 AS 别名的不明确列引用
我不确定在使用别名时如何解决不明确的列引用。假设有两个表，a 和 b，它们都有一个 name 列。如果我加入这两个表并为结果添加别名，我不知道如何为这两个表引用 name 列。我已经尝试了一些变体，
mysql - 具有 IN 条件的自定义订单
我的查询是: select * from table where id IN (1,5,4,3,2) 我想要的与这个顺序完全相同，不是从1...5，而是从1,5,4,3,2。我怎样才能做到这一点？最
c# - 具有@符号的列名
我正在使用 C# 代码执行动态生成的 MySQL 查询。抛出异常: CREATE TABLE dump ("@employee_OID" VARCHAR(50)); "{"You have an er
java - 具有 + 号的日期格式问题
我有日期 2016-03-30T23:59:59.000000+0000。我可以知道它的格式是什么吗？因为如果我使用 yyyy-MM-dd'T'HH:mm:ss.SSS，它会抛出异常最佳答案 Sim
MYSQL - 具有 in 子句的删除查询中的语法错误
我有一个示例模式，它的 SQL Fiddle 如下: http://sqlfiddle.com/#!2/6816b/2 这个 fiddle 只是根据 where 子句中的条件查询示例数据库，如下所示:

首页

博学

6Ren·AI

商城

python - 为什么我不想立即将所有可迭代对象转换为具有定义长度的内容(例如列表)？