python - 从生成器创建两个串联数组-6ren

python - 从生成器创建两个串联数组

转载作者：太空宇宙更新时间：2023-11-04 00:53:22

27

4

请考虑 Python 2.7 中的以下示例。我们有一个返回两个一维 numpy 数组的任意函数 f()。请注意，通常 f() 可能会返回不同大小的数组，并且大小可能取决于输入。

现在我们想在 f() 上调用 map 并将结果连接到两个单独的新数组中。

import numpy as np

def f(x):
    return np.arange(x),np.ones(x,dtype=int)   

inputs = np.arange(1,10)
result = map(f,inputs)
x = np.concatenate([i[0] for i in result]) 
y = np.concatenate([i[1] for i in result])

这给出了预期的结果。但是，由于结果可能会占用大量内存，因此最好通过调用 imap 而不是 map 来使用生成器。

from itertools import imap
result = imap(f,inputs)
x = np.concatenate([i[0] for i in result]) 
y = np.concatenate([i[1] for i in result])

但是，这会产生错误，因为在我们计算 y 时生成器是空的。

有没有办法只使用一次生成器并仍然创建这两个串联数组？我正在寻找没有 for 循环的解决方案，因为重复连接/附加数组效率很低。

提前致谢。

最佳答案

Is there a way to use the generator only once and still create these two concatenated arrays?

是的，可以用 tee 克隆生成器:

import itertools
a, b = itertools.tee(result)

x = np.concatenate([i[0] for i in a]) 
y = np.concatenate([i[1] for i in b])

但是，使用 tee 对您的情况下的内存使用没有帮助。上述解决方案需要 5 N 内存才能运行:

N 用于在 tee 中缓存生成器，
2 N 用于 np.concatenate 调用中的列表理解，
2 N 用于串联数组。

显然，我们可以通过删除 tee 来做得更好:

x_acc = []
y_acc = []
for x_i, y_i in result:
    x_acc.append(x_i)
    y_acc.append(y_i)

x = np.concatenate(x_acc)
y = np.concatenate(y_acc)

这又减少了一个 N，剩下 4 N。更进一步意味着删除中间列表并预分配 x 和 y。请注意，您不需要知道数组的确切大小，只需知道上限:

x = np.empty(capacity)
y = np.empty(capacity)
right = 0
for x_i, y_i in result:
    left = right
    right += len(x_i)  # == len(y_i)  
    x[left:right] = x_i
    y[left:right] = y_i

x = x[:right].copy()
y = y[:right].copy()

事实上，您甚至不需要上限。只需确保 x 和 y 足够大以容纳新项目:

for x_i, y_i in result:
    # ...
    if right >= len(x):
        # It would be slightly trickier for >1D, but the idea
        # remains the same: alter the 0-the dimension to fit 
        # the new item.
        new_capacity = max(right, len(x)) * 1.5
        x = x.resize(new_capacity)
        y = y.resize(new_capacity)

关于python - 从生成器创建两个串联数组，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36155631/

27

4

0

文章推荐： python - 无法重复我的代码中要求的内容

文章推荐： node.js - 如何修改node js响应

文章推荐： python - PySpark 将 DataFrame 保存到实际的 JSON 文件

python - 单例 python 生成器？或者，pickle 一个 python 生成器？
我使用以下代码和嵌套生成器迭代文本文档并使用 get_train_minibatch() 返回训练示例。我想保留( pickle )生成器，这样我就可以回到文本文档中的相同位置。但是，您不能 pick
JavaScript 生成器
在本教程中，您将借助示例了解 JavaScript 生成器。在 JavaScript 中，生成器提供了一种使用函数和迭代器的新方法。使用生成器，您可以从函数内部的任何位置停止执行函数并从
HTML 生成器？
LESS is very cool .我一直想知道是否有任何好的 html 生成器可以让我更轻松地编写表单或做其他事情。除了 html，是否有一些类似的东西？最佳答案已尝试 Haml ？从它的网
PHP中你可能忽略的性能优化利器：生成器
前言如果是做python或者其他语言的小伙伴，对于生成器应该不陌生。但很多php开发者或许都不知道生成器这个功能，可能是因为生成器是php 5.5.0才引入的功能，也可以是生成器作用不是很明显。
日期范围的 F# 生成器？
我正在尝试编写一个使用生成器语法生成日期时间列表的函数: let dateRange = let endDate = System.DateTime.Parse("6/1/2010")
python - 一个类轮通过一个可迭代的(生成器)
我遇到了一些看起来像的代码: [func(val) for val in iterable] 有一个可迭代对象(在我的例子中是一个生成器)，用户想要为其副作用调用每个值的函数(例如 func 可以只是
德尔福 UUID 生成器
Delphi 有内置的东西来生成 UUID 吗？最佳答案 program Guid; {$APPTYPE CONSOLE} uses SysUtils; var Uid: TGuid; Result
JavaScript ES6 生成器
我正在深入研究 javascript 生成器，但我真的很困惑。我使用 node@0.11.x 运行此示例: function find() { process.nextTick(functi
hibernate ID 生成器
有人知道一些关于如何为 hibernate 创建自定义 ID 生成器的好教程吗？最佳答案在 Google 上粗略搜索“hibernate 自定义 id 生成器教程”发现了以下可能性。我排除了那些看
用于并发的 python 生成器
我正在关注 Python 大师 David Beazley 的幻灯片。它指出“生成器也用于并发。这是一个示例: from collections import deque def countdown(
python - 生成器:以固定偏移量预处理事件
我有一个生成事件的生成器，我想用可以从 API 获取的附加元数据来丰富它。某些事件具有与其链接的对象 ID，而其他事件则具有对象的哈希值，但不能同时具有两者。我无法根据哈希获取对象 id，我只能执行
java - 自定义类项列表的循环迭代器/生成器
假设我有一个自定义类: public class CustomClass { private String name; private String data; public
php - MySql "WHERE"生成器
我正在考虑实现一个函数来在 SQL 请求中“构建”WHERE 子句，如下所示: "SELECT * FROM table $where" 使用如下所示的循环构建 $where: $arr=array(
永远返回相同内容的 Python 生成器
我正在寻找执行此操作的标准函数: def Forever(v): while True: yield v 这看起来太琐碎了，我不敢相信没有标准版本。就此而言，有人知道指向所有标准生成器函
支持多浏览器的 CSS 生成器
我知道这个网站上有几个非常相似的相关问题，但是在看了这部剧之后，我相信这个问题本身就是独一无二的。如果有人能找到并提供证据证明我的问题完全被骗了，我会自己撤回它(所以请不要否决这个!)。我是 Jav
C++ 生成器 TtcpClient
void __fastcall TForm1::Button1Click(TObject *Sender) { int size = MemoEnter->GetTextLen() + 1;
Python ctypes 生成器
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
Python 生成器 - 改变最后的结果？
我试图在我的生成器的以下两个定义之间做出决定。哪个更好？哪个“更像 python ”？无论如何，有没有办法减轻每一个的缺点？ def myGenerator1(howMany): result
要列出的 Python 生成器
我有一个 Python 生成器 lexg，它在每次迭代时生成一个列表。该代码似乎在传统的 for 循环意义上工作，即 for i in lexg(2,2): print(i) 产生: [2, 0] [
返回一系列时间的 Python 生成器
我希望这不会超出 Python 生成器的能力，但我想构建一个这样，每次调用该函数时，它都会返回下一分钟直到结束时间。因此该函数读取开始时间和结束时间，并以分钟为单位返回时间，直到涵盖其间的所有时间。

首页

博学

6Ren·AI

商城

python - 从生成器创建两个串联数组