c - 迭代机器代码时遇到问题-6ren

c - 迭代机器代码时遇到问题

转载作者：行者123 更新时间：2023-11-30 18:55:14

25

4

我正在尝试在 c 中重新创建 wc 命令，但在包含机器代码(核心文件或编译的 c)的任何文件中获取正确的单词数时遇到问题。记录的单词数总是比 wc 返回的单词数少 90% 左右。

这里是项目信息供引用

编译语句

gcc -ggdb wordCount.c -o wordCount -std=c99

wordCount.c

/*
 *  Author(s)   - Colin McGrath
 *  Description - Lab 3 - WC LINUX
 *  Date        - January 28, 2015
 */

#include<stdio.h>
#include<string.h>
#include<dirent.h>
#include<sys/stat.h>
#include<ctype.h>

struct counterStruct {
    int newlines;
    int words;
    int bt;
};

typedef struct counterStruct ct;

ct totals = {0};

struct stat st;

void wc(ct counter, char *arg)
{
    printf("%6lu %6lu %6lu %s\n", counter.newlines, counter.words, counter.bt, arg);
}

void process(char *arg)
{
    lstat(arg, &st);
    if (S_ISDIR(st.st_mode))
    {
        char message[4056] = "wc: ";
        strcat(message, arg);
        strcat(message, ": Is a directory\n");
        printf(message);
        ct counter = {0};
        wc(counter, arg);
    }
    else if (S_ISREG(st.st_mode))
    {
        FILE *file;
        file = fopen(arg, "r");
        ct currentCount = {0};
        if (file != NULL)
        {
            char holder[65536];
            while (fgets(holder, 65536, file) != NULL)
            {
                totals.newlines++;
                currentCount.newlines++;
                int c = 0;
                for (int i=0; i<strlen(holder); i++)
                {
                    if (isspace(holder[i]))
                    {
                        if (c != 0)
                        {
                            totals.words++;
                            currentCount.words++;
                            c = 0;
                        }
                    }
                    else
                        c = 1;
                }
            }
        }
        currentCount.bt = st.st_size;
        totals.bt = totals.bt + st.st_size;
        wc(currentCount, arg);
    }
}

int main(int argc, char *argv[])
{
    if (argc > 1)
    {
        for (int i=1; i<argc; i++)
        {
            //printf("%s\n", argv[i]);
            process(argv[i]);
        }
    }

    wc(totals, "total");

    return 0;
}

厕所输出示例:

    135     742  360448 /home/cpmcgrat/53/labs/lab-2/core.22321
    231    1189  192512 /home/cpmcgrat/53/labs/lab-2/core.26554
   5372   40960  365441 /home/cpmcgrat/53/labs/lab-2/file
     24     224   12494 /home/cpmcgrat/53/labs/lab-2/frequency
     45     116     869 /home/cpmcgrat/53/labs/lab-2/frequency.c
   5372   40960  365441 /home/cpmcgrat/53/labs/lab-2/lineIn
     12      50    1013 /home/cpmcgrat/53/labs/lab-2/lineIn2
      0       0       0 /home/cpmcgrat/53/labs/lab-2/lineOut
     39     247   11225 /home/cpmcgrat/53/labs/lab-2/parseURL
    138     318    2151 /home/cpmcgrat/53/labs/lab-2/parseURL.c
     41     230   10942 /home/cpmcgrat/53/labs/lab-2/roman
     66     162    1164 /home/cpmcgrat/53/labs/lab-2/roman.c
     13      13      83 /home/cpmcgrat/53/labs/lab-2/romanIn
     13      39     169 /home/cpmcgrat/53/labs/lab-2/romanOut
      7       6     287 /home/cpmcgrat/53/labs/lab-2/URLs
  11508   85256 1324239 total

重建输出示例(./wordCount):

   139     76 360448 /home/cpmcgrat/53/labs/lab-2/core.22321
   233    493 192512 /home/cpmcgrat/53/labs/lab-2/core.26554
  5372  40960 365441 /home/cpmcgrat/53/labs/lab-2/file
    25      3  12494 /home/cpmcgrat/53/labs/lab-2/frequency
    45    116    869 /home/cpmcgrat/53/labs/lab-2/frequency.c
  5372  40960 365441 /home/cpmcgrat/53/labs/lab-2/lineIn
    12     50   1013 /home/cpmcgrat/53/labs/lab-2/lineIn2
     0      0      0 /home/cpmcgrat/53/labs/lab-2/lineOut
    40      6  11225 /home/cpmcgrat/53/labs/lab-2/parseURL
   138    318   2151 /home/cpmcgrat/53/labs/lab-2/parseURL.c
    42      3  10942 /home/cpmcgrat/53/labs/lab-2/roman
    66    162   1164 /home/cpmcgrat/53/labs/lab-2/roman.c
    13     13     83 /home/cpmcgrat/53/labs/lab-2/romanIn
    13     39    169 /home/cpmcgrat/53/labs/lab-2/romanOut
     7      6    287 /home/cpmcgrat/53/labs/lab-2/URLs
 11517  83205 1324239 total

请注意前两个文件(核心文件)以及 roman 文件和 parseURL 文件(机器代码，无扩展名)的字数(第二个整数)的差异。

最佳答案

C 字符串不存储其长度。它们由一个 NUL 终止。 (0) 字节。

因此，strlen需要逐字符扫描整个字符串，直到到达 NUL 。这使得:

for (int i=0; i<strlen(holder); i++)

效率极低:对于 holder 中的每个字符，需要统计 holder 中的所有字符为了测试是否 i仍在范围内。这转换了一个简单的线性 Θ(N)算法转化为Θ(N<sup>2</sup>)循环燃烧器。

但在这种情况下，它也会产生错误的结果，因为二进制文件通常包含大量 NUL人物。自 strlen实际上会告诉你第一个NUL在哪里是，而不是“行”有多长，您最终会跳过文件中的很多字节。 (好的一面是，这使得扫描速度成倍加快，但更快地计算错误结果并不是真正的胜利。)

您不能使用fgets读取二进制文件，因为 fgets界面不会告诉您它读取了多少内容。您可以使用 Posix 2008 getline接口(interface)，或者您可以使用 fread 进行二进制输入，这更有效，但会迫使您自己计算换行符。 (这不是世界上最糟糕的事情；你似乎也算错了。)

或者，当然，您可以使用 fgetc 一次读取一个字符。。对于学校练习来说，这不是一个坏的解决方案。生成的代码很容易编写和理解，典型的实现是 fgetc比 FUD 所显示的更有效率。

关于c - 迭代机器代码时遇到问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28204948/

25

4

0

文章推荐： c - 在c中通过引用传递数组

文章推荐： C 循环开关？

文章推荐： Windows 和 Linux 下的 C 代码

文章推荐： python - 如何将多个变量从Python脚本传递到C shell脚本

java - Apache Tika - PrintWriter 适用于本地 Windows 机器，但不适用于 Linux 机器
我被难住了。如果我对文件路径进行硬编码，则此脚本在我的 Windows 机器上的 Eclipse 中运行良好。如果我尝试接受参数并在我的边缘节点(一个 linux 机器)上运行它，它不会抛出任何特定的
linux - 无法从同一 LAN 上的 Linux 机器 ping Windows 7 机器
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。关闭 8 年前。这个问题似乎不是关于 a specific programming problem,
java - AES 解密适用于 Solaris 机器 SunJCE，但不适用于具有 IBMJCE 的 AIX 机器
我们最近将我们的基础架构从 Solaris(Oracle/Sun Java) 迁移到 AIX(IBM Java)。我们的客户将使用我们共享的算法(AES)和 key 上传加密文件，一旦加密文件放置在
linux - 如何通过 ftp 从一台 Linux 机器(客户端)传输加密文件并在另一台 Linux 机器(服务器)上解密
我想编写一个程序(java)，它接受一个文件作为输入，对其进行加密(使用aes128)并通过ftp发送该加密文件，接收者接收它并使用 key 进行解密。我是初学者，有什么帮助可以做到这一点吗？非常感谢
c# - C# WinMobile 6.1 项目中的 C++ DLL - 1c2 机器 (Thumb) 与 14c 机器 (x86)
我正在尝试将一些为 1c2 机器 (thumb) 编译的 DLL 导入 WinMobile 6.1 C# 智能设备项目。然而，当我尝试将它们导入我的 C# 项目时，我得到“无法添加对...的引用”，
cpu - 寻找微型可编程FPGA+机器
我正在寻找 FPGA + 机器。它应该是入门级定价(例如不超过 200 美元)。编辑:我想制作一个 ASM 图表并将 FPGA 编程为我在图表中指定的行为最佳答案你看过Arduino ? 关于
Java bean 机器
这是我想完成的: Write a program that stimulates a bean machine Your program should prompt the user to enter
windows - Docker机器无法使用hyperv成功到达IP地址/机器
我尝试使用以下命令在 Windows 10 上使用 hyperv 创建一台机器: docker-machine create --driver hyperv default 但它给了我: This m
hadoop - 如何为每个节点(机器)配置hadoop映射器num
我有个问题我的问题是我有一个将 mapred.map.tasks 配置为10的作业(抓取工具)，这意味着我的工作将一次创建10个映射器。但是我的集群将 mapred.tasktracker.map.
docker - 无法重启 Docker 机器
我正在尝试使用命令重新启动 Docker sudo docker restart a7f8ce75f51f 但我收到以下错误 Error response from daemon: Cannot re
eclipse - 使用所有插件引导新的 Eclipse 机器
在新机器上引导 Eclipse 是一个非常耗时的过程，您最终会问自己是否真的需要每个插件。但这些都很方便，并且有助于养成一致的习惯。 Eclipse 引导问题包括: 解释/记录需要发生的事情粘贴正确
docker - 在不同的客户端设备上使用相同的 Docker 机器
我们希望建立一个 Docker 开发节点，我们团队中的任何人都可以将东西部署到其中。我使用 SSH 创建了一个新的 Docker 机器，如下所示: docker-machine create \
java - Java中的Singleton Logger可以记录日志方法来自哪个类并记录到多个区域/机器
如果可能的话，我想使用 java.util.logging 来做到这一点，有什么想法吗？谢谢。最佳答案您可以尝试一下SLF4J . Simple Logging Facade for Java (
vagrant - 如何在配置时解锁 Vagrant 机器
当 vagrant up 时，我们的 vagrant box 需要大约 1 小时才能提供第一次运行，在配置过程的最后，我想将盒子打包到本地文件夹中的图像，以便下次需要重建时将其用作基础盒子。我正在使用
python - 无法训练线性 SVM 机器
我正在为我的图像处理项目构建一个 SVM 线性机，在其中提取正样本和负样本的特征并将其保存到目录中。然后，我使用这些功能训练 SVM，但收到一个无法调试的错误。下面是我用于训练分类器的 train-c
mysql - 无法连接到 targat 机器
问题描述: 我要将MySQL server 5.7.11 (win32) 安装到Windows server 2012 中。服务器中安装了多个网络接口(interface)卡，我将安装多个绑定(bin
linux - 自动关闭预定的 Linux 机器
我想安排一台 (AWS) Linux 计算机启动、运行程序，然后自行关闭(以将成本保持在最低水平)。我可以放 mycommand; shutdown 在/etc/rc.local 文件中。但如果我需要
linux - 在网络服务器上设置 Linux 机器
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 4 年前。 Improve this ques
linux - 将文件的输出一行发送到远程 Linux 机器
如何将此文件的输出发送到另一台 Linux 计算机的主目录。显然，我想发送此文件的输出: sed '/^\s*#/d;/^$/d' /etc/httpd/conf/httpd.conf 到 nati
linux - 调试未知的 Linux 机器
我有一个 Linux 机器，我可以使用 SSH 进行 root 访问。我想使用GDB来调试系统。这是一个精简的 Debian 软件包；因此，我里面没有任何编译工具。 uname -a 给出: 2.

首页

博学

6Ren·AI

商城

c - 迭代机器代码时遇到问题