c++ - 如何更改此标记化过程以处理多行文本文件？-6ren

c++ - 如何更改此标记化过程以处理多行文本文件？

转载作者：太空宇宙更新时间：2023-11-04 12:28:35

25

4

我正在处理这个源代码:

#include <string>
#include <vector>
#include <iostream>
#include <istream>
#include <ostream>
#include <iterator>
#include <sstream>
#include <algorithm>

int main()
{
  std::string str = "The quick brown fox";

  // construct a stream from the string
  std::stringstream strstr(str);

  // use stream iterators to copy the stream to the vector as whitespace separated strings
  std::istream_iterator<std::string> it(strstr);
  std::istream_iterator<std::string> end;
  std::vector<std::string> results(it, end);

  // send the vector to stdout.
  std::ostream_iterator<std::string> oit(std::cout);
  std::copy(results.begin(), results.end(), oit);
}

为了，它不是标记单行并将其放入 vector 结果中，而是标记从此文本文件中提取的一组行并将生成的单词放入单个 vector 中。

Text File:
Munroe states there is no particular meaning to the name and it is simply a four-letter word without a phonetic pronunciation, something he describes as "a treasured and carefully-guarded point in the space of four-character strings." The subjects of the comics themselves vary. Some are statements on life and love (some love strips are simply art with poetry), and some are mathematical or scientific in-jokes.

到目前为止，我只清楚我需要使用

while (getline(streamOfText, readTextLine)){}

让循环运行。

但我认为这行不通:

while (getline(streamOfText, readTextLine)) { cout << readTextLine << endl;

//从字符串构造一个流 std::stringstream strstr(readTextLine);

//使用流迭代器将流作为空格分隔的字符串复制到 vector 中 std::istream_iterator 它(strstr)； std::istream_iterator 结束； std::vector results(it, end);

/*HOw CAN I MAKE THIS INSIDE THE LOOP WITHOUT RE-DECLARING AND USING THE CONSTRUCTORS FOR THE ITERATORS AND VECTOR? */

  // send the vector to stdout.
  std::ostream_iterator<std::string> oit(std::cout);
  std::copy(results.begin(), results.end(), oit);

          }

最佳答案

是的，那么您在readTextLine 中有一整行。这就是你在那个循环中想要的吗？然后不是从 istream 迭代器构造 vector ，而是复制到 vector 中，并在循环外定义 vector :

std::vector<std::string> results;
while (getline(streamOfText, readTextLine)){
    std::istringstream strstr(readTextLine);
    std::istream_iterator<std::string> it(strstr), end;
    std::copy(it, end, std::back_inserter(results));
}

如果您只需要流中的所有单词，而不需要逐行处理，那么您实际上不需要先将一行读入字符串。就像您在代码中所做的那样，直接从另一个流中读取。它不仅会从一行中读取单词，还会从整个流中读取单词，直到文件结尾:

std::istream_iterator<std::string> it(streamOfText), end;
std::vector<std::string> results(it, end);

要像您在评论中要求的那样手动完成所有操作，请执行

std::istream_iterator<std::string> it(streamOfText), end;
while(it != end) results.push_back(*it++);

我建议你读一本这方面的好书。我认为它将向您展示更多有用的技术。 C++ Standard library Josuttis 是一本好书。

关于c++ - 如何更改此标记化过程以处理多行文本文件？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/485371/

25

4

0

文章推荐： c++ - 如何编写给定自定义 IDL 的代码生成器？

文章推荐： linux - 如何在不完全停止 hostapd 的情况下暂停它

javascript - anchor 标记(标记)onclick 事件处理程序不工作
虽然我在 reactjs 组件(组件名称为 renderLocationLink)的渲染方法返回的 html 中包含了 a 标签的 onclick 处理程序，但渲染正确地发生了 onclick 处理程
ms-word - docx - 标记/标记 - docx 转换
我必须以 docx 格式存储一些文档，但无法忍受使用 msword:我想编辑某种纯文本标记，除了基于 XML 的东西(我也不喜欢那样)和从/到那个到/从 docx 转换。有什么选择吗？编辑:由于人
javascript - 一旦设置了 anchor 标记，在延迟后如何单击 anchor 标记？
有一个页面，其 anchor 标记在延迟后变得可点击。我想使用用户脚本在可点击后点击它。页面加载时，HTML 源代码为: Download 延迟一段时间后，#button 变
python - 解析 XML，搜索目标起始标记，并忽略其上方的所有标记
我正在将 XML 文件解析为 pandas 数据帧。使用下面的代码我可以成功获取所有内容，但是这使用了完整 XML 的编辑版本。完整的 XML 在主数据表之上有一堆摘要数据，请参阅完整的 XML he
python - 如何在提供给 python 中的 xml.sax 解析器之前从 xml 文件中删除特殊字符和 & 标记(无效的 xml 标记)
目前我正在研究 xml.sax 解析器来解析 xml 文件假设我有以下代码 filepath = 'users/file.xml' try: parser = xml.sax.make_pa
ANTLR - 树中的隐式 AND 标记
我正在尝试构建一种语法来解释用户输入的文本，搜索引擎风格。它将支持 AND、OR、NOT 和 ANDNOT bool 运算符。我几乎所有东西都在工作，但我想添加一个规则，将引用字符串之外的两个相邻关键
Terraform EKS 标记
我遇到了 Terraform EKS 标记的问题，并且似乎没有找到可行的解决方案来在创建新集群时标记所有 VPC 子网。提供一些上下文:我们有一个 AWS VPC，我们在其中将多个 EKS 集群部署
xpath - XPath返回XHTML文件中的第一个标记
我是xpath的新手，对此了解不多。我知道有一种方法可以使用xpath在xml / xhtml文件中查找特定标签。就我而言，我试图找到第一个（a）链接元素。不幸的是，我的xpath字符串[// a [
javascript - 单击内部按钮时防止单击父 A 标记
我在索引页上的产品卡上遇到问题。在产品卡内部，我有 Vue 组件来渲染表单(数量和添加到购物车按钮)。当我单击“添加到购物车”按钮时，我得到了预期的结果。响应被发送到根 vue 组件，然后我看到产品已
css - 背景颜色不适用于标记
html setMouse(true)} onMouseEnter={() => setMouse(false)} className='resume-container'> CSS .resum
delphi - 标记/取消标记一组枚举中的另一个选项
我在组件中有一组枚举，如下所示: type TOption = (clVisible, clVisibleAlways, clRenderable, clEditable); TOptions
用于性能考虑的 Javadoc 标记
是否有出于性能考虑的javadoc标签？人们可以想象: /** * ...other javadoc tags... * @perform Expected to run in O(n) tim
css - 背景颜色不适用于标记
html setMouse(true)} onMouseEnter={() => setMouse(false)} className='resume-container'> CSS .resum
Neo4j:更快的子图着色/标记
我有一个包含多个小子图的图。目标是当且仅当子图中的所有节点都是蓝色时，才将子图中的所有蓝色节点标记为红色。如果子图中的一个节点具有不同的颜色，绿色，那么我们将不会更改该子图中节点的颜色。这是我正在使
多个事件的 Gmail 标记
我正在使用 json-ld 开发事件标记以包含在确认电子邮件中。我的一些事件会定期重复发生。但是，最新的 Schema.org 规范不支持重复发生的事件，因此我遵循了此处提供的建议:http://l
java - 标记 -> 转到行号
我创建了一个插件，可以添加带有相应行号的标记。现在，这很棒，因为它现在显示在“标记” View 中。有没有办法当我双击标记上的一行时，它会转到标记指示的行？谢谢。最佳答案双击“标记” View
jquery - Facebook 标记
是否有一个插件具有与 Facebook 标记类似的行为？它的特别之处在于它具有: 在键入的单词之间自动完成特殊输出的 html(与另一个输入字段同步) 最佳答案您可以使用jquery提及输入pl
java - 分割字符串/标记
有没有更好的方法来读取java文件中的 token ？我目前正在使用 StringTokenizer 来分割 token 。但在大多数情况下，它的效率可能非常低，因为您必须逐个 token 地读取 t
Java:标记/标记文件
我想知道是否有某种方法可以标记文件来识别该文件是否包含x。考虑以下示例: 在批量转换过程中，我正在创建一个日志文件，其中列出了各个转换的成功/失败。所以流程如下: 开始转换过程创建名为batch
jquery模拟点击html anchor 标记
我一直在尝试模拟点击标签，但这并没有像我需要的那样工作。我的 anchor 标记看起来像这样 Download this pic 正常的 $("a").click() 或 trigger('cli

首页

博学

6Ren·AI

商城

c++ - 如何更改此标记化过程以处理多行文本文件？