rust - 如何从已拆分成多个部分的文件创建行迭代器？-6ren

rust - 如何从已拆分成多个部分的文件创建行迭代器？

转载作者：行者123 更新时间：2023-11-29 08:23:24

25

4

我有一个文件，我需要逐行阅读并分成两个句子，用“=”分隔。我正在尝试使用迭代器，但我找不到如何在 split 中正确使用它。文档说 std::str::Split 实现了这个特征，但我仍然不知道如何使用它。

use std::{
    fs::File,
    io::{prelude::*, BufReader},
};

fn example(path: &str) {
    for line in BufReader::new(File::open(path).expect("Failed at opening file.")).lines() {
        let words = line.unwrap().split("="); //need to make this an iterable
    }
}

我如何使用一个我知道已经实现到类似 split 的特征？

最佳答案

作为@Mateen commented , split已经返回一个可迭代对象。要解决生命周期问题，请保存 unwrap() 返回的值在调用 split 之前进入一个变量.

我将在这里尝试解释生命周期问题。

首先，查看函数签名确实很有帮助。

pub fn unwrap(self) -> T

pub fn split<'a, P: Pattern<'a>>(&'a self, pat: P) -> Split<'a, P>

unwrap非常简单，它拥有自己的所有权并返回内在值(value)。

split看起来很吓人，其实也不难，'a只是生命周期的名称，它只是说明返回值可以使用多长时间。在这种情况下，这意味着两个输入参数必须至少与返回值一样长。

//                   Takes by reference, no ownership change
//                               v
pub fn split<'a, P: Pattern<'a>>(&'a self, pat: P) -> Split<'a, P>
//           ^              ^      ^                         ^
//           |              |--|---|                         |
// This just declares a name.  |                             |
//                             |                             |
//           Both of these values must last longer than -----|

这是因为split不复制任何字符串，它只是指向原始字符串上发生拆分的位置。如果原始字符串由于某种原因被丢弃，Split不会指向无效数据。

一个变量的生命周期(除非所有权被传递给其他东西)一直持续到它超出范围，这要么在结束时}如果它被命名(例如使用 let )或者它在行尾/;

这就是为什么您的代码中存在生命周期问题:

for line in std::io::BufReader::new(std::fs::File::open(path).expect("Failed at opening file.")).lines() {
    let words = line
        .unwrap() // <--- Unwrap consumes `line`, `line` can not be used after calling unwrap(),
        .split("=") // Passed unwrap()'s output to split as a reference
        ; //<-- end of line, unwrap()'s output is dropped due to it not being saved to a variable, the result of split now points to nothing, so the compiler complains.
}

解决方案

保存unwrap()的返回值

for line in std::io::BufReader::new(std::fs::File::open("abc").expect("Failed at opening file.")).lines() {
    let words = line.unwrap();
    let words_split = words.split("=");
} // <--- `word`'s lifetime ends here, but there is no lifetime issues since `words_split` also ends here.

您可以重命名 words_split至 words如果您愿意，可以隐藏原始变量以免弄乱变量名称，这也不会引起问题，因为隐藏变量不会立即删除，而是在其原始范围的末尾删除。

或者

而不是使用类型为 str 的迭代器，所有这些都只是指向原始字符串的奇特指针，您可以将每个切片复制到它自己的字符串中，从而消除对将原始字符串保留在范围内的依赖。

在您的情况下，几乎可以肯定没有理由这样做，因为复制每个切片需要更多的处理能力和更多的内存，但 Rust 为您提供了这种控制权。

let words = line
    .unwrap()
    .split("=")
    .map(|piece|
        piece.to_owned() // <--- This copies all the characters in the str into it's own String.
    ).collect::<Vec<String>>()
    ; // <--- unwrap()'s output dropped here, but it doesn't matter since the pieces no longer points to the original line string.

let words_iterator = words.iter();

collect给你错误 cannot infer type因为你没有说明你想收集什么，要么使用上面的 turbofish 语法，要么在 words 上声明它即 let words: Vec<String> = ...

您必须调用 collect因为map除非您使用它，否则不会做任何事情，但这超出了本答案的范围。

关于rust - 如何从已拆分成多个部分的文件创建行迭代器？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53938867/

25

4

0

文章推荐： java - 使用方法引用来检查 boolean 值匹配而不是 lambda

文章推荐： php - 选择除查询中两个表中匹配的行之外的所有行

文章推荐： mysql - 如何从批量数据中的mysql列中删除所有非数字字符

emacs 分成 3 个偶数窗口
简单问题:如何指定分割窗口中的字符数？ C-x-3 将我的窗口均匀分割为两个窗口，但随后的分割会将其中一个窗口分成两半。我想要 3 个大小相同的 window 。文档说我应该能够指定左缓冲区的字符数作
javascript - 分成 40 组
我需要一个程序，可以接受用户输入的数据数量和长度(英尺和英寸或仅英寸)，并将这些项目分为 40 组。我最初尝试在 Excel 中完成此任务，但我不确定是否可以完成。 var cutList = [
java - 分成 double 不起作用
这个问题已经有答案了: Why does the division of two integers return 0.0 in Java? [duplicate] (6 个回答) 已关闭 5 年前。
java - MigLayout 分成 2 行
我想知道在使用布局 (MigLayout) 时我可以分成 2 行而不是两列吗？ panel.add(fname,"split 2"); panel.add(Fname,"wrap, pushx, gr
php - 将 mysql_num_rows 分成 6x4
我几乎有一个像下面这样的代码，我正在尝试添加每 6 个结果之后。 echo ""; $query="SELECT * WHERE id='$id' ORDER BY date ASC"; $resu
android - 现有 Activity 分成 fragment
我在 android 2.2 中创建了一个选项卡 fragment ，带有 android 兼容性支持库，现在在我的应用程序中我几乎没有 Activity ，其中一些是扩展 Activity 类和其
python - Pandas Dataframe 分成 session
这是我的 question 的扩展. 为了让它更简单让我们假设我有一个 pandas 数据框，如下所示。 df = pd.DataFrame([[1.1, 1.1, 2.5, 2.6, 2.5, 3.
xaml - 如何将 stackpanel 分成 7 个等高的矩形
我正在开发 Windows Phone 8 应用程序，其中我有一个 Stackpanel，我想在其中放置 7 个矩形。我希望这些矩形具有相同的高度，无论屏幕尺寸如何。我尝试设置 Height="*"
java - UTF-16 分成 2 个字符
我一直相信java使用UTF-16在内部对其字符进行编码。它使用 u+xxxx 的事实证实了这一点。表示字符代码的格式以及它使用 16 位存储 char 的事实。 . 但有时UTF-16需要超过 2
xaml - 如何将 stackpanel 分成 7 个等高的矩形
我正在开发 Windows Phone 8 应用程序，其中我有一个 Stackpanel，我想在其中放置 7 个矩形。我希望这些矩形具有相同的高度，无论屏幕尺寸如何。我尝试设置 Height="*"
c - 将 sbrk 分成 2 个
为了重新编码 malloc 函数，我执行了 sbrk(stack) 其中: void *malloc(size_t size) { stack = 0; while (stack start
jquery - 将表 td 分成 6 行或更少行的解决方案
寻找一个 css 或 jquery 解决方案来将这些动态加载的表分解为每行最多 6 个，创建表的脚本将它们全部内联，有时一行中显示多达 32 个 td.tables。我怎样才能在最多只有 6 个内联显
swift utf16 数据流 - 分成 block 的问题
我可以请求帮助将 UTF-16 数据流拆分成 block 吗？不幸的是，很难找到字母边界。任何帮助表示赞赏，已经花了几个晚上在这上面，很想了解这个问题。运行良好的 Java 版本(是否有任何自动
php - 将一个 div 分成 1 列以上
我正在使用 Contact Forms 7在 wordpress 安装中创建联系表单。创建的表单位于 here Contact Form 扩展是免费、灵活且易于使用的。但问题是，无论一个表单包含多少个
java - 根据我的数据库 varchar 大小分割字符串(分成 block )
我想将一个字符串拆分为一系列子字符串以适合我的数据库，假设我的数据库 varchar 大小为 50。如果将原始字符串切割为最多 50 个字符，那么我需要在该字符串中包含尾随 (逗号)。例如，我的原始
css - 将一个 div 分成 3 个部分
我必须用 css 做一个足球队盾牌，我的想法是用球队的颜色做一个圆圈，我已经用 1 种或 2 种颜色为盾牌做了圆圈，但我在使用 3 种颜色的盾牌时遇到了麻烦我将其用于 2 种颜色的防护罩 .equi
c# - 按数量递减将 x 分成 y 部分
如果我有 1000 美元(可变)，我想把这笔钱分给 20(可变)人，但不是平均地给每个人，我想给第一个人更多，然后第二人称等所以第 20 个人得到的最少，第 5 个人得到的第 5 多。我将如何实现
algorithm - 有限制地将 n 分成 k 个部分
我需要一种算法，将数字 n 分成 k 部分，并增加限制，即每个分区元素必须在 a 0 and k > 0: for x in range(a, b+1): fo
java - 我如何将 JPanel 分成 70% 30%
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Swing: How do I set a component height to the containe
Android - 如何将 View 分成 4 个相等的部分？
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 9

首页

博学

6Ren·AI

商城

rust - 如何从已拆分成多个部分的文件创建行迭代器？

解决方案