c - 使用 fork() 时，getline() 重复读取文件-6ren

c - 使用 fork() 时，getline() 重复读取文件

转载作者：塔克拉玛干更新时间：2023-11-03 00:32:51

24

4

我正在开发一个简单的 shell 程序，一个命令行解释器，我想逐行读取文件中的输入，所以我使用了 getline() 函数。第一次，程序运行正常，但是，当它到达文件末尾时，它并没有终止，而是从头开始读取文件并无限运行。以下是 main 函数中与 getline() 相关的一些代码:

int main(int argc,char *argv[]){
    int const IN_SIZE = 255;
    char *input = NULL;
    size_t len = IN_SIZE;
    // get file address
    fileAdr = argv[2];

    // open file
    srcFile = fopen(fileAdr, "r");

    if (srcFile == NULL) {
        printf("No such file!\n");
        exit(-1);
    }

    while (getline( &input, &len, srcFile) != -1) {
        strtok(input, "\n");
        printf("%s\n", input);
        // some code that parses input, firstArgs == input
        execSimpleCmd(firstArgs);            
    }
    fclose(srcFile);
}

我在我的程序中使用了 fork()，很可能是它导致了这个问题。

void execSimpleCmd(char **cmdAndArgs) {

    pid_t pid = fork();
    if (pid < 0) {
        // error
        fprintf(stderr, "Fork Failed");
        exit(-1);
    } else if (pid == 0) {
        // child process
        if (execvp(cmdAndArgs[0], cmdAndArgs) < 0) {
            printf("There is no such command!\n");
        }
        exit(0);
    } else {
        // parent process
        wait(NULL);
        return;
    }
}

此外，有时程序会读取并打印多行的组合。例如，如果输入文件如下:

ping
ww    
ls
ls -l
pwd

它会打印 pwdg、pwdww 等内容。如何修复？

最佳答案

在某些情况下，关闭 FILE 似乎会将底层文件描述符查找回应用程序实际读取到的位置，从而有效地消除读取缓冲的影响。这很重要，因为父项和子项的操作系统级文件描述符指向相同的文件描述，尤其是相同的文件偏移量。

POSIX description of fclose()有这个短语:

[CX] [Option Start] If the file is not already at EOF, and the file is one capable of seeking, the file offset of the underlying open file description shall be set to the file position of the stream if the stream is the active handle to the underlying file description.

(其中 CX means an extension to the ISO C standard 和 exit() 当然会在所有流上运行 fclose()。)

我可以用这个程序重现奇怪的行为(在 Debian 9.8 上):

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>

#include <sys/types.h>
#include <sys/wait.h>

int main(int argc, char *argv[]){
    FILE *f;
    if ((f = fopen("testfile", "r")) == NULL) {
        perror("fopen");
        exit(1);
    }

    int right = 0;
    if (argc > 1)
        right = 1;

    char *line = NULL;
    size_t len = 0;
    // first line 
    getline(&line, &len, f);
    printf("%s", line);

    pid_t p = fork();
    if (p == -1) {
        perror("fork");
    } else if (p == 0) {
        if (right)
            _exit(0);  // exit the child 
        else
            exit(0);   // wrong way to exit
    } else {
        wait(NULL);  // parent
    }

    // rest of the lines
    while (getline(&line, &len, f) > 0) {
        printf("%s", line);
    }

    fclose(f);
}

然后:

$ printf 'a\nb\nc\n' > testfile
$ gcc -Wall -o getline getline.c
$ ./get
getline   getline2  
$ ./getline
a
b
c
b
c

使用 strace -f ./getline 运行它清楚地显示了 child 正在寻找文件描述符:

clone(child_stack=NULL, flags=CLONE_CHILD_CLEARTID|CLONE_CHILD_SETTID|SIGCHLD, child_tidptr=0x7f63794e0710) = 25117
strace: Process 25117 attached
[pid 25116] wait4(-1,  <unfinished ...>
[pid 25117] lseek(3, -4, SEEK_CUR)      = 2
[pid 25117] exit_group(1)               = ?

(我没有看到用不涉及 fork 的代码的seek back，但我不知道为什么。)

那么，主程序上的 C 库从文件中读取数据 block ，然后应用程序打印第一行。 fork 之后，child 退出，并寻找 fd 回到应用程序级文件指针所在的位置。然后父级继续，处理读取缓冲区的其余部分，完成后，它继续从文件中读取。因为文件描述符被找回，所以从第二个开始的行再次可用。

在您的情况下，每次迭代中重复的 fork() 似乎会导致无限循环。

在子级中使用 _exit() 而不是 exit() 解决了问题在这种情况下，因为 _exit() 只退出进程，它不对 stdio 缓冲区进行任何管理。

使用 _exit()，任何输出缓冲区也不会刷新，因此您需要在 stdout 上手动调用 fflush()以及您正在写入的任何其他文件。

但是，如果您以相反的方式执行此操作，则子进程读取和缓冲的内容多于其处理的内容，那么子进程返回 fd 将很有用，这样父进程就可以从子进程实际离开的地方继续.

另一种解决方案是不将 stdio 与 fork() 混合使用。

关于c - 使用 fork() 时，getline() 重复读取文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54912662/

24

4

0

文章推荐： c++ - 一个函数可以返回一个指向它自己类型的指针吗？

文章推荐： android - 我们如何在 android 中创建 XMLWriter？

如果你有 fork ，GitHub 不允许 fork fork ？
有3个 repo : 有 OpenAI Baselines 存储库:https://github.com/openai/baselines . 我有它的 fork :https://github.co
fork - fork() 之后的文件描述符相同
我试图了解在调用 fork() 后复制文件描述符的含义及其对争用的可能影响。在“Linux 编程接口(interface)”24.2.1 (p517) 中: When a fork() is per
fork - systemd 如何使用 Type=fork 跟踪 fork 进程
我对 systemd 如何跟踪主进程存在后仍然存在的主进程的子进程感兴趣？最佳答案 Systemd 为此使用了 cgroups。在启动任何使用服务文件定义的可执行文件之前，systemd 会创建一个
c - Fork 问题 - 执行 fork() 后，fork 之前的命令也运行两次
这是输出--- 家长:我的pid是4525 parent :我 parent 的 pid 是 3350 parent 开始- 4525 3350 fork 前 fork 前 child 4526 45
github - 当我已经 fork 了另一个 fork 时，如何 fork 原始存储库
我之前 fork 了 jockm/vert.x 并向他发送了拉取请求。现在我想 fork vert-x/vert.x (jockm/vert.x 的上游)并向他们发送不同的拉取请求。但是，当我单击“F
fork - 控制 fork 进程的名称
我想控制从 Perl 脚本派生的进程的名称 a。理想情况下它会像这样: ./forker.pl | ... | | fork("forked.pl"); |\ | \ | `--------\ |
fork - 在 fork 系统调用之后在较低级别会发生什么？
我知道 fork() 在更高级别上做什么。我想知道的是这个—— 一旦有 fork 调用，trap 指令就会跟随并且控制跳转以执行 fork “处理程序”。现在，这个创建子进程的处理程序如何通过创建另一
c - 如果(fork())fork()
我正在研究操作系统测验，但我不知道输出什么 if(fork()) fork() 会产生。有人可以解释吗？我不明白这一行: if(fork()) 编辑: 我所说的“输出”是指如果执行此代码，将
c - 如何在工作流树中表示 fork() && fork()？
这个问题在这里已经有了答案: Why does this program print "forked!" 4 times? (6 个答案) 关闭 3 年前。在 C 中，fork() 函数将为父进程
c - fork() 内的 fork()
有什么方法可以区分程序中不同 fork() 函数创建的子进程。 global variable i; SIGCHLD handler function() { i--; } handle() {
mysql - fork 还是不 fork ？
我正在重新开发一个系统，该系统将通过 http 向多个供应商之一发送消息。原来是perl脚本，重新开发很可能也会用perl。在旧系统中，同时运行多个 perl 脚本，每个供应商运行 5 个。当一条消
Git - fork 或不 fork
Git 的新手，仍然有点困惑。我在 github 上 fork 了一个项目，想将项目所有者最近对原始项目所做的一些更改引入/merge 到我的 fork 中。这可能吗？该项目是只读的，但基本上，我想让
linux - fork() 中的写时复制如何处理多个 fork ？
根据维基百科(可能是错误的) When a fork() system call is issued, a copy of all the pages corresponding to the par
fork - 如何 fork 一个进程
我需要帮助了解如何在 Go 中妖魔化进程。 package main import ( "fmt" "os" ) func start() { var procAttr os.Pro
c - fork 的流量，我有多少个 fork ？
我已经执行了这段代码。我知道消息的顺序是任意顺序的(因为我明确没有使用信号量)我的程序流程如何？为什么？父级被执行，因此“baz”被打印一次。有人可以解释为什么不打印“bar”吗？为什么我得到“fo
c - c中fork()&&fork()||fork()是什么意思
这个问题已经有答案了: Why does this program print "forked!" 4 times? (6 个回答) 已关闭 5 年前。我对 fork 进程有疑问。我有一个代码是 i
c - Fork - 在 fork 进程之间共享列表
我在弄清楚如何使用在不同进程之间创建的列表时遇到了麻烦。我所拥有的是: FileList.h - 我创建的列表 #include "Node.h" typedef struct FileList {
c - fork 二叉树， fork 功能问题
好吧，所以我一直在 stackoverflow 上查找这个问题，并且肯定在谷歌上搜索了半个小时，但我得到的答案似乎与我真正想做的事情几乎没有任何关系，希望有人能提供帮助我在这方面，代码如下: int
java - Fork-join: fork 所有子任务或为当前线程留下一个子任务
我正在尝试了解 fork-join 的工作原理。维基百科有以下合并排序示例，其中左半部分被 fork ，右半部分由当前线程处理。 mergesort(A, lo, hi): if lo t
c - 如何将变量从子进程 fork() 传递到他的父进程 fork()
下面的代码输出了一系列的过程，它到底做了什么: _PARENT_ / \ /

首页

博学

6Ren·AI

商城

c - 使用 fork() 时，getline() 重复读取文件