c - 如何用 C 将二进制位写入二进制文件？-6ren

c - 如何用 C 将二进制位写入二进制文件？

转载作者：行者123 更新时间：2023-11-30 21:09:15

24

4

我正在尝试用 C 语言实现霍夫曼编码。我完成了树的构造，并随着算法的进行获得了每个符号的码字。但现在我不得不将代码字插入相应符号的二进制文件中。有人可以建议如何将代码字或二进制位写入二进制文件，以便我可以获得压缩文件。

码字的长度可变。

将这些位写入文件或从文件中读取这些位的函数会很有帮助。

这是我写的代码

void create_compressed_file()
{
    char str[20], ch, *str2, str1[10], str_arr[6], str3[10];
    FILE *fp, *fp2, *fp3;
    int i, array[20], j = 0;
    fp2 = fopen("newfile.txt", "r"); // contains the original text file
    fp3 = fopen("codeword.txt", "r"); // contains the symbol and codeword
    while (fscanf(fp2, "%s", &str) == 1) {
        rewind(fp3);
        str2 = strtok(str, "-");
        while (str2 != NULL) {
            strcpy(str_arr, str2);
            printf("str2= %s ", str_arr); //str2 stores the symbol(not char but a string)
            printf(" %s-", str2);
            while (fscanf(fp3, "%s", &str1) == 1) {
                if (strcmp(str1, str_arr) == 0) {
                    fscanf(fp3, "%s", &str1); // extracted corresponding codeword(1s and 0s) of   the symbol and stored it into str1
                    printf("%s\n", str1);
                    write_codeword_to_binaryfile(); // function that i want to create with is   incomplete and need your help.
                }
            }
            str2 = strtok(NULL, "-");
            rewind(fp3);
        }
        printf("\nspace:");
        strcpy(str_arr, "space");
        while (fscanf(fp3, "%s", &str1) == 1) {
            if (strcmp(str1, str_arr) == 0) {
                fscanf(fp3, "\n%s", &str1); // extract the codeword for(space)character  
                printf("%s\n", str1);
            }
        }
    }
    fclose(fp2);
    fclose(fp3);    
}

codeword.txt:

is  0000
por 00010
Plain   000110
most    0001110
the 0001111
ted 00100 
text    00101
ly  0011000
near    0011001
pli 0011010
ap  0011011
ble 0011100
ta  0011101
by  0011110
sup 0011111
cryp    0100000
In  0100001
ra  0100010
tog 0100011
ting    0100100
tain    0100101
mands   0100110
com 0100111
mes 0101000
to  0101001
ge  0101010
sa  0101011
plain   0101100
phy 0101101

我尝试了上面的代码，如下所示，但它没有写任何东西...执行后的文件大小为0字节:

#include <stdio.h>
#include <conio.h>
#include <stdint.h>

void write_codeword_to_binaryfile(
    const char *codeword, // codeword to write, in ASCII format
    FILE *file,           // destination file
    uint8_t *buffer,
    int *fullness)
{
    char c;
    //  fullness = ;
    *buffer = 0;
    for (c = *codeword++; c != '\0'; c = *codeword++) // iterate
    {
        int bit = c - '0'; // convert from ASCII to binary 0/1
        *buffer |= bit << (7 - fullness);
        ++fullness;
    }
    fputc(*buffer, file);
}

int main() {
    FILE *fp;
    uint8_t *buffer = 0;
    char *c = "10101010";
    char b = 0;
    int i;
    fp = fopen("myfile.bin", "wb");
    write_codeword_to_binaryfile(c, fp, buffer, 8);
    fclose(fp);
    getch();
}

最佳答案

首先，您应该以二进制模式打开文件:

fp = fopen("myfile", "wb"); // "b" means "binary"

这在 Windows 中是必须的，但在大多数其他平台上不是必需的(您不需要做任何特殊的事情来区分平台；只需使用“wb”)。

要将位写入文件，您应该使用缓冲区 - 部分填充的字节。当缓冲区填满时将缓冲区写入文件(恰好包含 8 个填充位)。

uint8_t buffer = 0;

您应该使用一个计数器来跟踪填充了多少位。

int fullness = 0;

写入文件的函数应该接收缓冲区及其填充度。因为它会改变它们，所以你实际上必须发送指针:

void write_codeword_to_binaryfile(
    const char *codeword, // codeword to write, in ASCII format
    FILE *file,           // destination file
    uint8_t *buffer,
    int *fullness)
{
    for (char c = *codeword++; c != '\0'; c = *codeword++) // iterate
    {
        int bit = c - '0'; // convert from ASCII to binary 0/1
        ...
    }
}

有两种方式来排列字节中的位 - 小端(第一位是最低有效位)或大端(第一位是最高有效位)。习惯的方式是使用大端排序。

如果你的缓冲区已填充一定数量的位，如何填充下一位？以下示例显示了填充了 5 位的缓冲区:

011011...
      ^
next bit to fill (its position, starting from the left, is 2)

从这个例子中可以看出，下一位的位置是7 - fullness。因此，对于每一位，请执行以下操作:

*buffer |= bit << (7 - *fullness);
++fullness;

参见How do you set, clear and toggle a single bit in C/C++?了解更多信息。

当缓冲区满时(fullness等于8)，将其写入文件:

fputc(*buffer, file);
*fullness = 0;
*buffer = 0;

完成消息编码后，您还应该“刷新”缓冲区(即将其写入文件):

if (*fullness > 0)
    fputc(*buffer, file);

<小时/>

顺便说一句，消息末尾发生的情况对于位级编码器来说是一个常见的重要问题。您应该从解码器的角度考虑它:您需要了解应该在文件的最后一个字节中解码多少位。有几种解决方案:

对消息进行编码后，再编码一个 1 位，然后编码零位，直到缓冲区已满。解码器需要反向解码零位和1位。这是 MPEG 使用的。
在文件头中写入消息的长度(以位为单位)。这可能是最简单的解决方案，尽管它需要在完成编码后更新文件的开头。
有一个特殊的代码字来表示“消息结束”(也经常使用)

关于c - 如何用 C 将二进制位写入二进制文件？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35273847/

24

4

0

文章推荐： Javascript 获取单个位

文章推荐： c# - 将 C# 项目迁移到 .NET 4.0 隐藏的问题和错误

android - 未处理的异常 : Android. Views.InflateException:二进制 XML 文件行 #1:二进制 XML 文件行 #1:类 fragment 膨胀时出错
我正在尝试将谷歌地图集成到 Xamarin Android。但是，如标题中所写，收到错误。此错误出现在我的 SetContentView (Resource.Layout.Main); 上，如下所示:
Delphi读取非文本文件(二进制)
在 Delphi 中如何以非文本模式打开二进制文件？类似于 C 函数 fopen(filename,"rb") 最佳答案有几个选项。 1。使用文件流 var Stream: TFileStrea
计算段中的一个(二进制)
我现在正在处理一个问题，如下所示: 有两个数字 x1 和 x2 并且 x2 > x1。例如 x1 = 5; x2 = 10; 而且我必须在二进制表示中找到 x1 和 x2 之间的总和。 5 = 10
gcc - 二进制 AND (&) 的无效操作数
我有这个“程序集”文件(仅包含 directives ) // declare protected region as somewhere within the stack .equiv prot_s
Powershell 二进制 grep
有没有办法在powershell中确定指定的文件是否包含指定的字节数组(在任何位置)？就像是: fgrep --binary-files=binary "$data" "$filepath" 当然，
Delphi 二进制/文本文件必要性
我是一名工程师，而不是软件程序员，所以请原谅我的无知。我编写了一个 Delphi(7SE) 程序，用于从连接到两个数字温度计的 USB 端口读取“真实”数据类型。我已经完成了该计划的大部分内容。
c++ - 二进制 + 的无效操作数
我有一些代码，例如: u=(float *)calloc(n, sizeof(float)); for(i=1; i
c++ - 二进制 * 的无效操作数
typedef struct pixel_type { unsigned char r; unsigned char g; unsigned char b;
c++ - 二进制-十进制负位集
如何判断二进制数是否为负数？目前我有下面的代码。它可以很好地转换为二进制文件。转换为十进制时，我需要知道最左边的位是否为 1 以判断它是否为负数，但我似乎无法弄清楚该怎么做。此外，我如何才能让它返
c++ - 二进制 * 运算符未找到
我有一个带有适当重载的 Vect*float 运算符的 vector 类，我正在尝试创建全局/非成员 float*Vect 运算符，如下所示:(注意这是一个经过大量编辑的示例) class Vect
图像的转换--->二进制--->图像使用C
对于使用 C 编程的项目，我们正在尝试将图像转换为二进制数据，反之亦然。我们在网上找到的所有其他解决方案都是用 C++ 或 Java 编写的。这是我们尝试过的方法: 将图像转换为包含二进制数据的文本文
python - (二进制)对列表的元素求和
我需要对列表的元素求和，其中包含所有零或一，如果列表中有 1，则结果为 1，否则为 0。 def binary_search(l, low=0,high=-1): if not l: retu
python - 如何将浮点十进制转换为浮点八进制/二进制？
我到处搜索以找到将 float 转换为八进制或二进制的方法。我知道 float.hex 和 float.fromhex。是否有模块可以对八进制/二进制值执行相同的工作？例如:我有一个 float 1
c - 二进制 "|"的无效操作数
当我阅读有关 list.h 文件中的 hlist 的 FreeBSD 源代码时，我对这个宏感到困惑: #define hlist_for_each_entry_safe(tp, p, n, head,
c - 二进制 % 的操作数无效？
我不知道出了什么问题，也不知道为什么会出现此错误。我四处搜索，但我终究无法弄明白。 void print_arb_base(unsigned int n, unsigned int b) {
algorithm - 十进制转位(二进制)
在任何语言中都可以轻松地将十进制转换为二进制，反之亦然，但我需要一个稍微复杂一点的函数。给定一个十进制数和一个二进制位，我需要知道二进制位是开还是关(真或假)。示例: IsBitTrue(30,1
c - 为什么使用此代码创建的文本文件具有字符集 == 二进制？
在下面的代码中，我创建了两个文件，一个是文本格式，另一个是二进制格式。文件的图标显示相同。但是这两个文件的特征完全相同，包括大小、字符集(==二进制)和流(八位字节)。为什么没有文本文件？因为如果我明
Python 二进制 EOF
我想通读一个二进制文件。谷歌搜索“python binary eof”引导我here . 现在，问题: 为什么容器(SO 答案中的 x)不包含单个(当前)字节而是包含一大堆字节？我做错了什么？如果应
python - 二进制/十六进制浮点输入
为什么只允许以 10 为基数使用小数点？为什么以下会引发语法错误？ 0b1011101.1101 我输入的数字是否有歧义？除了 93.8125 之外，字符串似乎没有其他可能的数字同样的问题也适用于其
c++ - boost::二进制<>
boost 库中有二进制之类的东西吗？例如我想写: binary a; 我很惭愧地承认我曾尝试找到它(Google、Boost)但没有结果。他们提到了一些关于 binary_int<> 的内容，但我既

首页

博学

6Ren·AI

商城

c - 如何用 C 将二进制位写入二进制文件？