rust - 将 Iterator<(A,B)> 拆分为 Iterator<A> 和 Iterator-6ren

rust - 将 Iterator<(A,B)> 拆分为 Iterator 和 Iterator

转载作者：行者123 更新时间：2023-11-29 07:54:45 26 4

我想拆分实现 Iterator<(A,B)> 的对象的输出分为两个实现 Iterator<A> 的对象和 Iterator .由于其中一个输出的迭代次数可能比另一个多，因此我需要缓冲 Iterator<(A,B)> 的输出。 (因为我不能依赖 Iterator<(A,B)> 是可克隆的。)问题是迭代器可能是无限的，所以我不能简单地将迭代器的输出收集到两个缓冲区中并在两个缓冲区上返回迭代器。

看来我需要保留 A 的缓冲区和 B对象，只要其中一个缓冲区为空，我就会用 Iterator<(A,B)> 中的样本填充它目的。这意味着我需要两个可迭代结构，它们具有对输入迭代器的可变引用(因为它们都需要在输入上调用 next() 来填充缓冲区)，这是不可能的。

那么，有什么方法可以安全地完成这个任务吗？

最佳答案

这是可能的。正如您所确定的，您需要从两个句柄对基本迭代器的可变引用，这可以使用 a type with "internal mutability" 来实现。，即使用 unsafe 的一个内部代码公开一个安全的 API 来获取 &mut到可别名数据(即包含在 & 中)通过动态强制执行编译器通常在编译时在 unsafe 之外强制执行的不变量.

我假设您愿意将两个迭代器保持在一个线程上¹，因此，在这种情况下，我们需要一个 RefCell 。 .我们还需要能够访问 RefCell来自两个句柄，需要存储 &RefCell<...>或 Rc<RefCell<...>> .前者限制太多，因为它只允许我们在 RefCell 所在的栈帧中和栈帧下方使用一对迭代器。被创建，而我们希望能够自由地传递迭代器，所以 Rc 是的。

总而言之，我们基本上要存储一个 Rc<RefCell<Iterator<(A,B)>>> ，只有缓冲的问题。适合这里工作的工具是 RingBuf 因为我们想要在前面和后面进行高效的 push/pop。因此，我们共享的内容(即在 RefCell 中)可能如下所示:

struct SharedInner<A, B, It> { iter: It, first: RingBuf<A>, second: RingBuf, }

我们可以将实际共享的类型缩写为type Shared<A, B, It> = Rc<RefCell<SharedInner<A, B, It>>>; ，它允许我们定义迭代器:

struct First<A, B, It> { data: Shared<A, B, It> } impl Iterator<A> for First<A,B,It> { fn next(&mut self) -> Option<A> { // ... } }

实现next首先要做的是获得 &mut到 SharedInner , 通过 self.data.borrow_mut(); .然后从中取出一个元素:检查正确的缓冲区，或者从 iter 中取出一个新元素。 (记得缓冲剩余的 B ):

let mut inner = self.data.borrow_mut(); inner.first.pop_front().or_else(|| { inner.iter.next().map(|(a,b)| { inner.second.push(b); a }) })

文档: RingBuf.pop_front , Option.or_else .

另一边的迭代器是类似的。总计:

use std::cell::RefCell; use std::collections::{Deque, RingBuf}; use std::rc::Rc; struct SharedInner<A, B, It> { iter: It, first: RingBuf<A>, second: RingBuf } type Shared<A, B, It> = Rc<RefCell<SharedInner<A, B, It>>>; struct First<A, B, It> { data: Shared<A, B, It> } impl<A,B, It: Iterator<(A,B)>> Iterator<A> for First<A, B, It> { fn next(&mut self) -> Option<A> { let mut inner = self.data.borrow_mut(); // try to get one from the stored data inner.first.pop_front().or_else(|| // nothing stored, we need a new element. inner.iter.next().map(|(a, b)| { inner.second.push(b); a })) } } struct Second<A, B, It> { data: Shared<A, B, It> } impl<A,B, It: Iterator<(A,B)>> Iterator for Second<A,B,It> { fn next(&mut self) -> Option { let mut inner = self.data.borrow_mut(); inner.second.pop_front().or_else(|| { inner.iter.next().map(|(a, b)| { inner.first.push(a); b }) }) } } fn split<A, B, It: Iterator<(A,B)>>(it: It) -> (First<A, B, It>, Second<A, B, It>) { let data = Rc::new(RefCell::new(SharedInner { iter: it, first: RingBuf::new(), second: RingBuf::new(), })); (First { data: data.clone() }, Second { data: data }) } fn main() { let pairs = range(1u32, 10 + 1).map(|x| (x, 1.0 / x as f64)); let (mut first, mut second) = split(pairs); println!("first:"); for x in first.by_ref().take(3) { println!(" {}", x); } println!("second:"); for y in second.by_ref().take(5) { if y < 0.2 { break } println!(" {}", y); } let a = first.collect::<Vec<u32>>(); let b = second.collect::<Vec<f64>>(); println!("a {}\nb {}", a, b); }

打印

first: 1 2 3 second: 1 0.5 0.333333 0.25 0.2 a [4, 5, 6, 7, 8, 9, 10] b [0.166667, 0.142857, 0.125, 0.111111, 0.1]

playpen .

有多种方法可以对此进行优化，例如在 First 中获取时, 只缓冲剩下的 B如果 Second句柄存在。

¹ 如果您希望在单独的线程中运行它们，只需替换 RefCell用 Mutex 和 Rc用 Arc , 并添加必要的界限。

关于rust - 将 Iterator<(A,B)> 拆分为 Iterator<A> 和 Iterator，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25586681/

26 4 0

文章推荐： mysql - 如何在 select 语句中使用 AVG(field)

文章推荐：带有 "[^a-zA-Z0-9]+"的 Java String.split 仍然将空格显示为一个单词

文章推荐： java - 插入查询既不执行也不给出异常

文章推荐： java - 创建数组的新实例时程序卡住

java - Arraylist 分为 -
我有一个数组列表: ArrayList allText = new ArrayList(); 其内容是这样的: [Alabama - Montgomery, Alaska - Juneau, Ariz

php - 开始和结束时间，分为 1 小时段
我有一个 timestamp 格式的开始和结束时间。我想将它们分成多个时间段，例如 1 小时。 $t1 = strtotime('2010-05-06 12:00:00'); $t2 = strtot

css - span10 分为 3 列
我需要将 span10 分成 3 列，但我无法将它们排列起来。我应该在 span10 中添加一个 span12 还是使用 offset 还是？？

Pandas - 分为 24 小时区 block ，但不是午夜到午夜
我有一个时间序列。我想从早上 8 点到第二天早上 7:59 分成 24 小时的区 block 。我知道如何按日期分组，但我尝试过使用 TimeGroupers 和 DateOffsets 处理这个 8

java - Android Java 分为 4 个整数
我收到“街道号码邮政编码城市”形式的地址(作为字符串)。我想要做的是将街道和号码与邮政编码和城市分开。通常你可以按空格分割。但有些街道名称中也有空格，例如:“Emile Van Ermengemlaa

java - 将 JList 分为 2 组的优化方法
我有一个用户列表。其中一些用户处于第一状态，而其他用户处于第二状态。所以我想要的是将这个列表显示为首先，它按排序顺序显示存在 = 1 的用户，然后按排序顺序显示存在 = 2 的用户。这里的排序是根据用

javascript - 将 div 分为 3 列
我感觉我搜索了整个网络，但找不到一种方法将不同高度的 div 很好地划分为 3 列，就像 http://www.ing.nl 上那样 headertekst headerteksttesth

css - td 内的 Bootstrap 按钮下拉菜单，分为 2 行
Bootstrap 3 按钮下拉菜单出现问题。你可以在这里看到我的两个例子: http://www.bootply.com/W1dLusilMk http://www.bootply.com/GGBv

javascript - 返回的 php JSON 分为 2 个 Javascript 对象
我在 php 中执行以下操作 foreach($QuestionAsekd as $k => $v){ $grp_name = $v['NAME']; $groupValues[$gr

python - Pandas DataFrame [cell=(label,value)]，分为 2 个独立的数据框
我找到了一种用pandas解析html的绝妙方法。我的数据格式有点奇怪(见下文)。我想将这些数据拆分为 2 个单独的数据帧。注意每个单元格如何由，分隔...是否有任何真正有效的方法来分割所有这些单元

html - CSS
分为 2 列。没有
或

HTML 看起来像这样，但我不允许对其进行更改。我只能编写 CSS 将其变成 2 列。 Povezave www.behance.net www.kiberpipa.org www.o

python - Pandas 数据帧 : convert 2 columns (value, 值)分为 2 列(值，类型)
假设我有以下数据框“A” utilization utilization_billable service 1

html - 需要 2 个 100% 宽度的文本框，分为 2 个(50% x 50%)以及一个提交按钮
我需要将 2 个文本框拉伸(stretch)到 100% 的浏览器宽度，以及一个提交按钮。所有三个都应该在一行中，我试图拉伸(stretch)它但它没有发生......有什么想法吗？代码: .sea

行者123

个人简介
我是一名优秀的程序员,十分优秀！

作者热门文章

html - 出于某种原因，IE8 对我的 Sass 文件中继承的 html5 CSS 不友好？

JMeter 在响应断言中使用 span 标签的问题

html - 在 :hover and :active? 上具有不同效果的 CSS 动画

html - 相对于居中的 html 内容固定的 CSS 重复背景？

滴滴打车优惠券免费领取

全站热门文章

【NAS】绿联NAS+极狐Gitlab+1Panel

Java调用与发布Webservice接口（一）

vmagent如何快速采集和转发Metrics

深入理解二叉查找树(BST)的重要查找操作

MockQueryable：LINQ查询模拟测试工具

在K8S中创建Pod是如何使用到GPU的：nvidiadeviceplugin源码分析

Java的HTTP接口测试框架Gatling

为什么推荐在.NET中使用YAML配置文件

私有网盘+在线文档：内网离线搭建NextCloud+OnlyOffice详细指南

基于JavaSpringBoot的音乐网站与分享平台

首页

博学

6Ren·AI

商城

rust - 将 Iterator<(A,B)> 拆分为 Iterator 和 Iterator