gpt4 book ai didi

c - .txt 与 .csv 解析 C

转载 作者:太空宇宙 更新时间:2023-11-04 02:36:32 25 4
gpt4 key购买 nike

我创建了一个代码,使用 C 语言将 .txt 文件解析为 double 组。我的 .txt 文件经过格式化,因此每个点都由 "," 分隔。现在我想让这段代码解析相同的数据,但来自 .csv 文件。当我更改我的文件类型时,我收到一个段错误。

为什么会出现这种情况?我是否错误地认为这两种文档类型将以相同的方式阅读?

这篇文章的主要问题是,读取 .txt 和 .csv 有什么区别?

/* 
* Calibration File Read Test
*/
#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int main ()
{
FILE *myfile = fopen ( "BarEast.txt", "r" );
/* I want to change this file type to .csv */

/* opening file for reading */
if(myfile == NULL)
{
printf("Error opening file");
return(-1);
}

int i = 0;
int j, k;

char *result[361] = {0};
char line[10];
char *value;

while(fgets(line, sizeof(line), myfile))
{
value = strtok(line, ",");
result[i] = malloc(strlen(value) + 1);
strcpy(result[i], value);
i++;
}

double val;
double cal[361] = {0};

for(k = 0; k < 361; k++)
{
val = atof(result[k]);
cal[k] = val;
}

for(j = 0; j < 361; j++)
{
printf("Element[%d] = %f\n", j, cal[j]);
}
fclose(myfile);
return 0;

}

最佳答案

问题不在于文件名,而在于文件具有不同的内容。不同的内容暴露了代码中的内存问题。

我的目光立刻转向了到处都是硬编码的 361。这假设输入文件中有 361 行,并且存在您的段错误。当 val = atof(result[k]); 离开 result 数组时,它发生在第 40 行(使用 valgrind 识别)。在 C 中硬编码大小非常诱人。千万别做,尤其是输入,是个靠不住的拐杖。

相反,代码必须适应文件中的字段数和行数。您可以使用 realloc 编写您自己的动态数组代码,但是有很多 C 库可以为您完成这项工作,而且效果会更好。我伸手去拿 GLib基础知识。

另一个问题是您只为每行分配了 10 个字节。这是非常小的。这意味着如果 fgets 超过 9 个字符(它将是),它会不断地离开 line。从输入读取时任何类型的静态内存分配都会成为问题。使用 getline而不是 fgets 避免了每行分配多少内存的问题。 getline 会为您处理这件事。小心,getline 重用了 line,所以如果你要改变 line,你需要先 strdup .

/* 
* Calibration File Read Test
*/
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <glib.h>

int main (int argc, char **argv)
{
/* Check we got the right number of arguments. */
if( argc != 2 ) {
fprintf(stderr, "Usage: %s <filename>\n", argv[0]);
return -1;
}

/* Open the file */
FILE *fp = fopen ( argv[1], "r" );
if(fp == NULL)
{
fprintf(stderr, "Error opening file %s for reading.\n", argv[1]);
return(-1);
}

/* A dynamic array which will grow as needed */
GArray *result = g_array_new(TRUE, TRUE, sizeof(char *));

/* Read each line using getline which does the line memory allocation
for you. No buffer overflow to worry about. */
char *line = NULL;
size_t linecap = 0;
while(getline(&line, &linecap, fp) > 0) {
/* This will only read the first cell. Exercise left for the reader. */
char *value = strtok(line, ",");
if( value == NULL ) {
fprintf(stderr, "Could not parse %s\n", line);
continue;
}

char *field = malloc(strlen(value) + 1);
strcpy(field, value);

g_array_append_val(result, field);
}

free(line);
fclose(fp);

/* Iterate through the array using result->len to know the length */
for(int i = 0; i < result->len; i++)
{
printf("Element[%d] = %s\n", i, g_array_index(result, char *, i));
}

/* Free the array */
g_array_free(result, TRUE);

return 0;

}

我已经去掉了 atof 转换,因为它分散了主要问题的注意力。如果你愿意,你可以把它放回去。

这仍然有问题,它只读取每行的第一个单元格。我把它留给你解决。

关于c - .txt 与 .csv 解析 C,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36485200/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com