gpt4 book ai didi

c - 使用 C 从文件中删除相邻的重复行

转载 作者:太空宇宙 更新时间:2023-11-04 01:49:27 26 4
gpt4 key购买 nike

如果空行是重复的,也应该删除它们。如果行有转义序列(如 \t),它不同于空行。下面的代码删除了太多行,或者有时会留下重复项。如何解决这个问题?

#include <stdio.h>
#include <stdlib.h>

int main()
{
char a[6000];
char b[6000];
int test = 0;
fgets(a, 6000, stdin);
while (fgets(b, 6000, stdin) != NULL) {
for (int i = 0; i < 6000; i++) {
if (a[i] != b[i]) {
test = 1;
}
}
if (test == 0) {
fgets(b, 6000, stdin);
} else {
printf("%s", a);
}
int j = 0;
while (j < 6000) {
a[j] = b[j];
j++;
}
test = 0;
}
return 0;
}

最佳答案

您的逻辑基本上是正确的。您的思路是正确的:

  1. 将一行读入previous (a)。
  2. 将另一行读入current (b)。
  3. 如果previouscurrent内容相同,则转到第2步。
  4. 打印上一个
  5. current 移动到 previous
  6. 转到第 2 步。

然而,这仍然存在一些问题。


不必要的行读取

首先,考虑这段代码:

while(fgets(b,6000,stdin)!=NULL) {
...
if(test==0) {
fgets(b,6000,stdin);
}
else {
printf("%s",a);
}
...
}

如果 ab 具有相同的内容 (test==0),则使用未经检查的 fgets 再次读取一行,除非在评估循环条件 fgets(b,6000,stdin)!=NULL 时读取again。问题是您几乎忽略了刚刚阅读的行,这意味着您将未知行从 b 移动到 a。由于循环已经读取了另一行并适本地检查了失败,所以让循环读取该行,并将 if 语句的相等性测试反转为打印 a if test !=0.


最后一行在哪里?

您的逻辑也不会打印最后一行。考虑一个只有 1 行的文件。您读取它,然后循环条件中的 fgets 尝试读取另一行,但由于您位于文件末尾而失败。循环外没有打印语句,因此您永远不会打印该行。

现在如果一个文件有两行不同的行呢?您阅读第一行,然后是最后一行,看到它们不同,然后打印第一行。然后用最后一行覆盖第一行的缓冲区。您无法阅读另一行,因为没有更多内容,最后一行也没有打印出来。

您可以通过将第一个(未选中的)fgets 替换为 a[0] = 0 来解决此问题。这使得 a 的第一个字节成为空字节,这意味着字符串的结尾。它不会与您阅读的一行进行比较,因此 test==1,即 a 将被打印。由于 a 中没有要打印的字符串,因此不会打印任何内容。然后一切照常进行,b 的内容被移入 a 并读取另一行。


独特的最后一行问题

这留下了一个问题:如果最后一行不是重复的,则不会打印它。要解决此问题,只需打印 b 而不是 a


最终配方

  1. 0 分配给 previous (a[0]) 的第一个字节。
  2. 将一行读入current (b)。
  3. 如果previouscurrent内容相同,则转到第2步。
  4. 打印当前
  5. current 移动到 previous
  6. 转到第 2 步。

如您所见,它与您现有的逻辑没有太大区别;只有步骤 1 和 4 不同。它还确保检查所有 fgets 调用。如果文件中没有行,则不会打印任何内容。如果文件中只有 1 行,则会打印出来。如果两行不同,则打印两行。如果两行相同,则打印第一行。


可选:优化

  • 不是检查所有 6000 个字节,而是只检查任一字符串中的第一个空字节,因为 fgets 会自动添加一个以标记字符串的结尾。
  • 更快的方法是在 for 循环的 if 语句中添加一个 break 语句。如果单个字节不匹配,则整行都不是重复的,因此您可以尽早停止比较——如果在两个 1000 字节的行中只有字节 10 不同,速度会快得多!

关于c - 使用 C 从文件中删除相邻的重复行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46862888/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com