gpt4 book ai didi

delphi - coding.getstring 不返回字符串

转载 作者:行者123 更新时间:2023-12-03 15:26:48 28 4
gpt4 key购买 nike

我使用的是 Delphi 2009。

这对我来说适用于所有情况,除了一种情况:

var
BOMLength: integer;
Buffer: TBytes;
Encoding: TEncoding;
Value: string;

SetLength(Buffer, 2048);
CurFileStream.Read(Buffer[0], 2048);

Encoding := nil;
BOMLength := TEncoding.GetBufferEncoding(Buffer, Encoding);
Value := Encoding.GetString(Buffer);

在一种情况下它不起作用,该文件是一个小的简单文件,以 UTF8 字节顺序标记 (BOM) 开头,即十六进制:“EF BB BF”,并包含以下内容:

0 HEAD
0 @I1@ INDI
1 NAME Barthel Lee /Brenner/
2 CONT MAURICE F. WEAVER
2 CONT When I was eleven or twelve years old, I went to Camp Marguette for a w
2 CONC eek or two in the summertime. It was operated by Catholic Charities and w
0 TRLR

调用 CurFileStreamRead 后,当我检查 Buffer 的值时,它包含 BOM,后跟文件,并用 0 填充 Buffer 的其余 2048 个字符。 Encoding 正确检测到 UTF8 BOM 并将 BOMLength 设置为 3。

但是,在Encoding.GetString语句之后,Value的值为空字符串:''。

我在这周围放置了一个 try-except block 来 try catch 任何异常,但没有。

该代码适用于其他 500 个不同类型的文件,但不适用于此文件。

有谁知道我可以做些什么来解决这个问题,以便正确读取文件?

或者文件可能有问题,但我不确定它有什么不同,或者如何识别可能不同或错误的内容。

<小时/>

后续:

雷米的回答是正确的。我现在已经确定,这只是小文件,小于缓冲区大小(在我的例子中为 2048 字节),如果不设置长度,则无法工作。

正如我所指出的,缓冲区的剩余部分被零填充。这肯定是导致 Encoding.GetString 函数无法返回值的原因。但当它知道何时停止时,那就没问题了。

最佳答案

如果源字节为空或者无法解码字节,

GetString() 将返回一个空字符串(而不是引发异常)。在您的情况下,您并没有告诉 GetString() 忽略 BOM 或缓冲区的未填充部分。另外,请确保 Encoding 最初为零。

var
BOMLength: integer;
Buffer: TBytes;
BufLength: Integer;
Encoding: TEncoding;
Value: string;
begin
SetLength(Buffer, 2048);
BufLength := CurFileStream.Read(Buffer[0], Length(Buffer));

Encoding := nil;
BOMLength := TEncoding.GetBufferEncoding(Buffer, Encoding);
Value := Encoding.GetString(Buffer, BOMLength, BufLength - BOMLength);
end;

如果仍然不起作用,则源数据中很可能存在非法字节。

关于delphi - coding.getstring 不返回字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25028467/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com