gpt4 book ai didi

ios - 在 ios 上用 C 读取大文本文件

转载 作者:太空宇宙 更新时间:2023-11-04 03:47:29 24 4
gpt4 key购买 nike

我有一个 vb6 程序,它从 sql server 读取数据并将它们写入文本文件。每条记录由换行符分隔。这些文件(也可以> 200mb)必须在 sqlite 数据库中从 iPad 读取和写入。为了避免内存警告,我用 C 中的这个函数读取了文件的每一行

"strRet"是C中读取的字符串

"NSString *stringa"是字符串C转成NSString

NSDictionary *readLineAsNSString(FILE *f,int pospass,BOOL testata,int primorecord  )
{
char *strRet = malloc(BUFSIZ);//(char *) togliere perche con c potrebbe restituire un int
if (strRet==NULL)
{
return nil;
}

int size = BUFSIZ;

BOOL finito=NO;
int pos = 0;
int c;
fseek(f,pospass,SEEK_SET);

do{ // read one line

c = fgetc(f);

if (pos >= size-1)
{
size=size+BUFSIZ;
strRet = realloc(strRet, size);
if (strRet==NULL)
{
return nil;
}

}

if(c != EOF)
{
strRet[pos] = c;
pos=pos+1;
}
else
{
finito=YES;
}

}while(c != EOF && c != '\n');

if (pos!=0)
{
strRet[pos] = '\0';
}

NSString *stringa=[NSString stringWithCString:strRet encoding:NSASCIIStringEncoding];

if (pos==0)
{
stringa=@"";
}

long long sizerecord;
if (pos!=0)
{
sizerecord= (long long) [[NSString stringWithFormat:@"%ld",sizeof(char)*(pos)] longLongValue];
}
else
{
sizerecord=0;
}
pos = pospass + pos;

NSDictionary *risultatoc = @{st_risultatofunzione: stringa,
st_criterio: [NSString stringWithFormat:@"%d",pos],
st_finito: [NSNumber numberWithBool:finito],
st_size: [NSNumber numberWithLongLong: sizerecord]
};

//Svuoto il buffer
free(strRet);
// free(tmpStr);
strRet=NULL;

return risultatoc;

}

但是,当我在文件中有一个特殊字符(例如 € 符号或重音字母或某些北欧国家)时,记录无法正确读取,我发现自己有一个随机字符的 NSString而不是正确的。你知道你帮我吗?谢谢!

最佳答案

以下行告诉 iOS 您有 ASCII 数据:

NSString *stringa= [NSString stringWithCString:strRet encoding:NSASCIIStringEncoding];

但是,€ 符号或重音字母不是 ASCII 的一部分。所以你显然有不同。

弄清楚它是什么编码(例如 UTF-8、Windows ANSI、ISO-8859-1)并相应地更新行,例如:

NSString *stringa= [NSString stringWithCString:strRet encoding: NSWindowsCP1251StringEncoding];

更新

弄清楚正在使用的编码可能很棘手。

根据我的经验,VB6 和 SQL Server 是一对很好的组合,因为它们通常不会弄乱编码。薄弱的部分是文本文件,它依赖于编码但不包含任何关于使用何种编码的明确信息。 VB6 可能使用 Windows 默认设置,这取决于您的语言设置。遗憾的是,我不知道您可以在 Windows 中的何处查看默认编码。

在西方国家,编码通常设置为 Windows ANSI 代码页 1251(常量 NSWindowsCP1251StringEncoding 的来源)。

你或多或少可以验证一下。如果您打开包含欧元符号 (€) 的文本文件,如果它使用 CP 1251 编码,则它必须使用值 80(十六进制)。在 Latin-1(又名 ISO-8859-1)中,您不能表示欧元符号。在 Latin-9(又名 ISO-8859-15)中,它将使用 A4(十六进制)。在 UTF-8 中,需要三个字节:E2 82 AC。

所以自己查吧。如果您不确定,请添加文本文件相关部分的十六进制转储。

关于ios - 在 ios 上用 C 读取大文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23130450/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com