gpt4 book ai didi

c - 如何在 C 中使用正则表达式查找文件中的一行?

转载 作者:太空狗 更新时间:2023-10-29 15:33:52 25 4
gpt4 key购买 nike

如何在 C 编程中使用正则表达式?例如,如果我想在文件中查找一行

DAEMONS=(sysklogd network sshd !netfs !crond)

然后像这样在单独的行中打印每个守护进程

sysklogd 
network
sshd
!netfs
!crond

这是我到目前为止所做的

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <regex.h>
#define tofind "[a-z A-Z] $"
int main(){
FILE *fp;
char line[1024];
int retval = 0;
char address[256];
regex_t re;

if(regcomp(&re, tofind, REG_EXTENDED) != 0)
return;

fp = fopen("/etc/rc.conf","r");//this file has this line "DAEMONS=(sysklogd network sshd !netfs !crond)"
while((fgets(line, 1024, fp)) != NULL) {
if((retval = regexec(&re, address, 0, NULL, 0)) == 0)
printf("%s\n", address);
}
}

如有任何帮助,我们将不胜感激。

最佳答案

您将该行读入line,因此您应该将line 传递给regexec()。您还需要考虑行尾的换行符是否会影响模式。 (使用 fgets() 是正确的,但请记住它在末尾保留换行符。)

您还应该执行 return -1;(或任何其他不是 0 模 256 的值)而不是没有值的普通 return。另外,您应该检查文件是否已打开;我不得不使用另一个名称,因为我的机器 - MacOS X 上没有/etc/rc.conf 这样的文件。

这对我有用:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>
#include <sys/types.h>
#include <regex.h>

#define tofind "[a-z A-Z] $"

int main(int argc, char **argv)
{
FILE *fp;
char line[1024];
int retval = 0;
regex_t re;
//this file has this line "DAEMONS=(sysklogd network sshd !netfs !crond)"
const char *filename = "/etc/rc.conf";

if (argc > 1)
filename = argv[1];

if (regcomp(&re, tofind, REG_EXTENDED) != 0)
{
fprintf(stderr, "Failed to compile regex '%s'\n", tofind);
return EXIT_FAILURE;
}

fp = fopen(filename, "r");
if (fp == 0)
{
fprintf(stderr, "Failed to open file %s (%d: %s)\n",
filename, errno, strerror(errno));
return EXIT_FAILURE;
}

while ((fgets(line, 1024, fp)) != NULL)
{
line[strlen(line)-1] = '\0';
if ((retval = regexec(&re, line, 0, NULL, 0)) == 0)
printf("<<%s>>\n", line);
}
return EXIT_SUCCESS;
}

如果您需要帮助编写正则表达式而不是帮助编写使用它们的 C 代码,那么我们需要设计正则表达式以匹配您显示的行。

^DAEMONS=([^)]*) *$

这样只要按图这样写,就会匹配到该行。如果您可以在“S”和“=”之间或“=”和“(',那么您需要进行适当的修改。我允许尾随空格 - 人们通常很草率;但如果他们使用尾随制表符,那么该行将不会被选中。

找到线后,您必须将其拆分成多个部分。您可能会选择使用“捕获”括号工具,或者简单地使用 strchr() 来查找左括号,然后使用合适的技术来分隔守护程序名称 - 我会避免使用 strtok () 并可能使用 strspn()strcspn() 来查找单词。


#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>
#include <sys/types.h>
#include <regex.h>

#define tofind "^DAEMONS=\\(([^)]*)\\)[ \t]*$"

int main(int argc, char **argv)
{
FILE *fp;
char line[1024];
int retval = 0;
regex_t re;
regmatch_t rm[2];
//this file has this line "DAEMONS=(sysklogd network sshd !netfs !crond)"
const char *filename = "/etc/rc.conf";

if (argc > 1)
filename = argv[1];

if (regcomp(&re, tofind, REG_EXTENDED) != 0)
{
fprintf(stderr, "Failed to compile regex '%s'\n", tofind);
return EXIT_FAILURE;
}

fp = fopen(filename, "r");
if (fp == 0)
{
fprintf(stderr, "Failed to open file %s (%d: %s)\n", filename, errno, strerror(errno));
return EXIT_FAILURE;
}

while ((fgets(line, 1024, fp)) != NULL)
{
line[strlen(line)-1] = '\0';
if ((retval = regexec(&re, line, 2, rm, 0)) == 0)
{
printf("<<%s>>\n", line);
printf("Line: <<%.*s>>\n", (int)(rm[0].rm_eo - rm[0].rm_so), line + rm[0].rm_so);
printf("Text: <<%.*s>>\n", (int)(rm[1].rm_eo - rm[1].rm_so), line + rm[1].rm_so);
char *src = line + rm[1].rm_so;
char *end = line + rm[1].rm_eo;
while (src < end)
{
size_t len = strcspn(src, " ");
if (src + len > end)
len = end - src;
printf("Name: <<%.*s>>\n", (int)len, src);
src += len;
src += strspn(src, " ");
}
}
}
return EXIT_SUCCESS;
}

其中有大量调试代码 - 但您不会花很长时间来生成您请求的答案。我得到:

<<DAEMONS=(sysklogd network sshd !netfs !crond)>>
Line: <<DAEMONS=(sysklogd network sshd !netfs !crond)>>
Text: <<sysklogd network sshd !netfs !crond>>
Name: <<sysklogd>>
Name: <<network>>
Name: <<sshd>>
Name: <<!netfs>>
Name: <<!crond>>

注意:当你想在正则表达式中使用反斜杠时,你必须在 C 源代码中编写两个反斜杠。

关于c - 如何在 C 中使用正则表达式查找文件中的一行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3643427/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com