gpt4 book ai didi

c++ - 使用 std::getline 检测输入结束

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:07:17 25 4
gpt4 key购买 nike

我有一个包含以下片段的代码:

std::string input;
while(std::getline(std::cin, input))
{
//some read only processing with input
}

当我运行程序代码时,我通过文件 in.txt(使用 gedit 创建)重定向标准输入,它包含:

ABCD
DEFG
HIJK

在文件 in.txt 中,上述每一行都以一个换行符结尾。

我遇到的问题是,while循环运行3次后(每一行),程序控制没有前进,卡住了。我的问题是为什么会发生这种情况,我该怎么做才能解决这个问题?

一些说明:

我希望能够从命令行运行程序:

$ gcc program.cc -o out
$ ./out < in.txt

附加信息:

我做了一些调试,发现 while 循环实际上运行了 4 次(第四次输入为空字符串)。这导致程序循环停止,因为 //some processing read only with input 无法完成其工作。

所以我提炼的问题:

1) 为什么第 4 个循环在运行?

Rationale behind having std::getline() in the while loop's condition must be that, when getline() cannot read any more input, it returns zero and hence the while loop breaks.

Contrary to that, while loop instead continues with an empty string! Why then have getline in the while loop condition at all? Isn't that bad design?

2) 如果不使用 break 语句,如何确保 while 不会运行第 4 次?

For now I have used a break statement and string stream as follows:

std::string input;
char temp;
while(std::getline(std::cin, input))
{
std::istringstream iss(input);
if (!(iss >>temp))
{
break;
}
//some read only processing with input
}

But clearly there has to be a more elegant way.

最佳答案

DeadMG's answer相反,我相信问题出在您的输入文件的内容上,而不是您对换行符行为的期望。


更新: 现在我有机会使用 gedit,我想我明白了导致问题的原因。 gedit 显然是为了让在最后一行没有换行符的情况下创建文件变得困难(这是明智的行为)。如果您打开 gedit 并键入三行输入,在每行末尾键入 Enter,然后保存文件,它实际上会创建一个 4 行文件,其中第 4 行是空的。使用您的示例,文件的完整内容将是 "ABCD\nEFGH\nIJKL\n\n"。为避免创建额外的空行,只需不要在最后一行的末尾键入 Entergedit 将为您提供所需的换行符。

(作为一种特殊情况,如果您根本不输入任何内容,gedit 将创建一个空文件。)

请注意这个重要区别:在 gedit 中,键入 Enter 会创建一个新行。在存储在磁盘上的文本文件中,换行符(LF,'\n')表示当前行的结尾。


文本文件表示因系统而异。行尾标记最常见的表示是单个 ASCII LF(换行符)字符(Unix、Linux 和类似系统),以及两个字符的序列,CR 和 LF (MS Windows)。我将在这里假设类 Unix 表示。 (更新:在评论中,您说您使用的是 Ubuntu 12.04 和 gcc 4.6.3,因此文本文件绝对应该是 Unix 风格的格式。)

我刚刚根据你问题中的代码编写了以下程序:

#include <iostream>
#include <string>
int main() {
std::string input;
int line_number = 0;
while(std::getline(std::cin, input))
{
line_number ++;
std::cout << "line " << line_number
<< ", input = \"" << input << "\"\n";
}
}

然后我创建了一个 3 行文本文件 in.txt:

ABCD
EFGH
IJHL

在文件 in.txt 中,每一行都以一个换行符结束。

这是我得到的输出:

$ cat in.txt
ABCD
EFGH
IJHL
$ g++ c.cpp -o c
$ ./c < in.txt
line 1, input = "ABCD"
line 2, input = "EFGH"
line 3, input = "IJHL"
$

文件末尾的最后一个换行符不会开始换行符,它只是标记当前行的结尾。 (不以换行符结尾的文本文件甚至可能无效,具体取决于系统。)

如果我在 in.txt 的末尾添加一个 second 换行符,我可以得到你描述的行为:

$ echo '' >> in.txt
$ cat in.txt
ABCD
EFGH
IJHL

$ ./c < in.txt
line 1, input = "ABCD"
line 2, input = "EFGH"
line 3, input = "IJHL"
line 4, input = ""
$

程序在输入文件的末尾看到一个空行因为在输入文件的末尾有一个空行

如果您检查 in.txt 的内容,您会在最后发现 两个 换行 (LF) 字符,一个标记第三个字符的结尾行,还有一个标记(空)第四行的结尾。 (或者,如果它是 Windows 格式的文本文件,您会在文件的最后找到一个 CR-LF-CR-LF 序列。)

如果您的代码不能正确处理空行,那么您应该确保它不会在其输入中收到任何空行,或者更好的是,修改它以便它正确处理空行。 如何处理空行?这取决于程序需要做什么,并且可能完全取决于您。您可以静默跳过空行:

if (input != "") {
// process line
}

或者您可以将空行视为错误:

if (input == "") {
// error handling code
}

或者您可以将空行视为有效数据。

在任何情况下,您都应该准确决定要如何处理空行。

关于c++ - 使用 std::getline 检测输入结束,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19673332/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com