gpt4 book ai didi

c - 用于 lzw 压缩的可变长度字符串数组

转载 作者:行者123 更新时间:2023-11-30 15:51:40 25 4
gpt4 key购买 nike

这里是函数本身。我在那里遇到了段错误,因为显然我无法将字符串分配给数组中的该值。 clang/gcc 都给我一个警告。 Clang 的好一点,它是“期望 char 分配 char *”。我不知道还有什么其他方法可以使用该字典,因为我尝试过的所有方法都不起作用。我还将为其添加所有辅助函数,但我很确定它就在这个函数本身中。

像往常一样,我会对任何有效的答案投赞成票,并且我会接受我个人选择的答案。无论如何,我将在下面发布其余的“助手”功能。

void lzw_compress(char *uncompressed_data,size_t uncompressed_length,char *out){
unsigned long i=0,j=0;
char *character=malloc(1);
char *word=malloc(65535);
char *word_character=malloc(65535);
unsigned long word_size=0;
long *tmp_buffer=malloc(65535);
char *dictionary=malloc(130000);
for(i=0;i<=255;++i){
dictionary[i]=base_dictionary[i];
}
long index=0;
unsigned long dictionary_size=256;
for(i=0;i<uncompressed_length;++i){
character[0]=(unsigned char )uncompressed_data[i];
//arrcat(word_character,word,word_size,character);
for(j=0;j<word_size;++j){
word_character[j]=word[j];
}
word_character[j]=*character;
index=search(dictionary,dictionary_size,word_character);
if(index!=-1){
for(j=0;j<(word_size+1);++j){
word[j]=word_character[j];
}
++word_size;
}
else{
tmp_buffer[j++]=index;
++dictionary_size;
//dictionary[dictionary_size++]=(unsigned long *)word_character;

dictionary[dictionary_size]=*word_character;

word=*character;
word_size=1;
}
}
if(memcmp(word,"",1)!=0){
tmp_buffer[j++]=search(dictionary,dictionary_size,word);
}
char *debug="";
for(i=0;i<j;++i){
sprintf(debug,"%s%lu,",debug,tmp_buffer[i]);
}
printf("%s",debug);

}

long search(char *table,unsigned long table_length,char
*search_value){
unsigned long i=0;
for(i=0;i<table_length;++i){
if(table[i]==*search_value){
return i;
}
}
return -1;
}

正如你所看到的,我正在尝试用纯 c 语言编写一个类似 lzw 的程序。我总是使用 -Wall -std=c99 进行编译(因为我偶尔使用 p99.h 来滥用预处理器宏)。但由于某种原因,我无法让我的字符串数组工作,我知道我已经使用了类似的代码(但显然我没有备份它......)但无论如何是的。我无法弄清楚我应该如何(正确地)做到这一点。我将非常感谢任何人在这个问题上的帮助。

按照正常情况,除非另有说明,否则我在这里发布的任何代码都是公共(public)领域,一旦我使整个代码正常工作,我会将其发布在这里,以便任何其他寻找它的人也可以使其正常工作。

最后感谢您阅读这篇文章,并帮助我(如果您知道如何)。一旦我进城回来(如果已经有答案),我就会检查/标记事情。但不要因此而泄气,因为您的解决方案可能比我选择的解决方案更好,而且您仍然会获得赞成票。

编辑1:将代码编辑为之前的内容(根据git)。

编辑2:修正了很多东西,让它看起来更好。数组比较功能仍然无法正常工作(由于某些奇怪的原因)。

最佳答案

现在您已经有了分配,有几点可以确定为错误:

for(i=0;i<uncompressed_length;++i){
character[0]=(unsigned char )uncompressed_data[i];
//arrcat(word_character,word,word_size,character);
for(j=0;j<word_size;++j){
word_character[j]=word[j];
}

最初,word指向的内存未初始化,word_size为1。因此,您复制不确定的char word[ 0]word_character[0]。我不确定您是否应该最初设置 word_size = 0,或者移动复制循环,或者其他什么。

word_character[j]=character;

您正在将 char* 分配给 char。您可能指的是 word_character[j] = *character; (或 character[0] 而不是 *character,这是等效的)。

  dictionary[dictionary_size]=word_character;

再次将 char* 分配给 char。我无法猜测您在这里想要什么,因为 dictionary_size 在循环中没有更改。也许您想增加 dictionary_size 并复制 word_character 字符串?

    word=character;
word_size=1;

在这里,您丢失了最初分配给 word 的内存句柄(通常称为内存泄漏),并让 word 指向一个内存块,该内存块有足够的空间容纳一个个字符。您可能想复制指向的字符,

word[0] = character[0];

那里?

<小时/>

原始代码的初始答案:

void lzw_compress(char *uncompressed_data,size_t uncompressed_length,char *out){
unsigned long i=0,j=0;
char *character;
char *word;
char *word_character;
unsigned long word_size=1;
long *tmp_buffer=malloc(65535);
char *dictionary;
for(i=0;i<=255;++i){
dictionary[i]=base_dictionary[i];
}

您尚未为dictionary分配任何指向的内存,这是具有非零段错误概率的未定义行为。

long index=0;  
unsigned long dictionary_size=256;
for(i=0;i<uncompressed_length;++i){
character[0]=(unsigned char )uncompressed_data[i];

您也没有为字符分配内存,这又是未定义的行为。

    //arrcat(word_character,word,word_size,character);
for(j=0;j<word_size;++j){
word_character[j]=word[j];
}

word_characterword 也不指向分配的内存,更多未定义的行为。

    word[j]=(unsigned long)character;

您正在将 char* 转换为 unsigned long 并将该值分配给(未分配的)char。即使 word[j] 是有效的内存,这里的意图是什么?

    index=search(dictionary,dictionary_size,word_character);
if(index!=-1){
for(j=0;j<(word_size+1);++j){
word[j]=word_character[j];
}
++word_size;
}
else{
tmp_buffer[j++]=index;
++dictionary_size;
//dictionary[dictionary_size++]=(unsigned long *)word_character;
for(j=0;j<word_size;++j){
dictionary[dictionary_size]=word_character;
}
word=character;
word_size=1;
}
}
if(memcmp(word,"",sizeof word)!=0){

sizeof wordchar* 的大小。您可能打算在此处使用字符串的长度。

    tmp_buffer[j++]=search(dictionary,dictionary_size,word);
}
char *debug="";
for(i=0;i<j;++i){
sprintf(debug,"%s%lu,",debug,tmp_buffer[i]);

使用重叠的源和目标调用 sprintf 是未定义的行为。在这种情况下,它甚至是一个字符串文字。字符串文字不可修改,因此这是未定义行为的另一个来源,并且可能由于尝试修改字符串文字而导致崩溃。

    }
printf("%s",debug);

}

关于c - 用于 lzw 压缩的可变长度字符串数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14940825/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com