c++ - 如何使用 ifstream (C++) 只读取一些以前知道的行-6ren

c++ - 如何使用 ifstream (C++) 只读取一些以前知道的行

转载作者：太空狗更新时间：2023-10-29 20:36:15

24

4

通过对文件进行预处理，我找到了一些需要进一步处理的行，知道我想阅读这些行。有没有比使用 ifstream::getline(...) 逐行读取更快的解决方案？

例如，我知道我只需要产品行 4 (0-4-8-12-16-...) 或存储在 vector 中的特殊行号...

现在我正在这样做:

string line;
int counter = 0;
while( getline(ifstr,line) ){
   if(counter%4 =0){
      // some code working with line
   }
}

但我想要这样的东西(如果更快的话)

while(getline(ifstr,line)){ 
  // some code working with line
  while(++counter%4 !=0){ // or checking on index vector
     skipline(ifstr)         
  }
}

让我再次提一下，我有一些行索引(已排序但不是这个常规索引)，但为了简单起见，我使用了这个 product4 示例。

编辑:我想跳到开头的行，例如我知道我需要从第 2000 行开始读取，如何快速跳过 1999 行？谢谢大家

最佳答案

因为@caps 说这让他觉得标准库中没有任何东西可以帮助完成这种任务，所以我觉得有必要证明其他情况:)

Live On Coliru

template <typename It, typename Out, typename Filter = std::vector<int> >
Out retrieve_lines(It begin, It const end, Filter lines, Out out, char const* delim = "\\n") {
    if (lines.empty())
        return out;

    // make sure input is orderly
    assert(std::is_sorted(lines.begin(), lines.end()));
    assert(lines.front() >= 0);

    std::regex re(delim);
    std::regex_token_iterator<It> line(begin, end, re, -1), eof;

    // make lines into incremental offsets
    std::adjacent_difference(lines.begin(), lines.end(), lines.begin());

    // iterate advancing by each offset requested
    auto advanced = [&line, eof](size_t n) { while (line!=eof && n--) ++line; return line; };

    for (auto offset = lines.begin(); offset != lines.end() && advanced(*offset) != eof; ++offset) {
        *out++ = *line;
    }

    return out;
}

这明显更通用。权衡(目前)是标记化迭代器需要随机访问迭代器。我发现这是一个很好的权衡，因为文件上的“随机访问”无论如何都需要内存映射文件

现场演示 1:从字符串到 `vector<string>`

Live On Coliru

int main() {
    std::vector<std::string> output_lines;
    std::string is(" a b c d e\nf g hijklmnop\nqrstuvw\nxyz");

    retrieve_lines(is.begin(), is.end(), {0,3,999}, back_inserter(output_lines));

    // for debug purposes
    for (auto& line : output_lines)
        std::cout << line << "\n";
}

打印

 a b c d e
xyz

现场演示 2:从文件到 `cout`

Live On Coliru

#include <boost/iostreams/device/mapped_file.hpp>
int main() {
    boost::iostreams::mapped_file_source is("/etc/dictionaries-common/words");

    retrieve_lines(is.begin(), is.end(), {13,784, 9996}, std::ostream_iterator<std::string>(std::cout, "\n"));
}

打印例如

ASL's
Apennines
Mercer's

The use of boost::iostreams::mapped_file_source can easily be replaced with straight up ::mmap but I found it uglier in the presentation sample.

关于c++ - 如何使用 ifstream (C++) 只读取一些以前知道的行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39317617/

24

4

0

文章推荐： c++ - 当使用指向数组的指针时，我们迭代什么？

文章推荐： c# - 由于布局影响，打开 WPF 窗口速度很慢

文章推荐： c++ - 是否允许将指向对象的指针与 nullptr 进行比较？

文章推荐： python - 如果条件为真，如何更改单个条的颜色

javascript - Firestore 分页 - 以前
我是 firebase 的新手，我正在尝试分页查询。我喜欢有一个“下一个”和“上一个”按钮。我的下一个按钮工作正常，我的问题是单击上一个引用:https://firebase.google.com/
php - 创建新的、以前 undefined variable 的函数
抱歉，标题这么蹩脚，但我只是不知道该放什么，希望你能理解。另外，我不知道以前是否有人问过类似的问题，因为我不知道合适的关键字 - 因此也无法用谷歌搜索。基本上...在查看preg_match_all
c# - 以编程方式 checkout 以前 checkin 的文件版本
我想在 TFS 中 check out 一个检入文件的先前版本。我可以轻松获得特定文件的变更集 ID 列表，但无法弄清楚如何 checkout 以前的版本。我目前的代码: var workspace
java - 以前 Java 版本中 Java 运行时保留注释的兼容性
我想使用 @FunctionalInterface来 self 代码中的 Java 8，但我希望能够将生成的类文件与 Java 6 一起使用。我认为我应该将源版本设为 1.8 , 目标版本为 1.6
homebrew - 如何安装专为不同(以前)版本的 macOS 设计的 Homebrew 瓶
自从 versions 被删除以来，我一直无法找到安装以前版本软件的方法。命令并点击 Homebrew。我在 2008 Mac Pro (3,1) 上运行 macOS 10.14.3 (Mojave)
iphone - 将 iPod 支持添加到(以前)仅限 iPhone 的应用程序
当我开始当前的项目时，App Store 中已经有一个应用程序。此应用程序仅适用于 iPhone。我的第一个任务是测试和构建一个也可以在 iPod Touch 上运行的版本。大约 3 周前，App
git - 从 GitHub 上的(以前 fork 的) repo 中删除 fork repo 消息？
我在 GitHub 上有一个曾经是 fork 的 repo，但现在不是了，因为我已经删除了原始项目的任何痕迹并开始了一个同名的新项目。但是，GitHub 仍然表示该项目是 fork 的。有什么方法可

首页

博学

6Ren·AI

商城