- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
Delphi XE在Encoding
类中添加了TStrings
属性,该属性存储在调用LoadFromFile()
时从BOM表读取的编码。
Delphi 2010没有此属性。
我想效仿它。
我为TStrings
创建了以下类帮助器。
该助手可以工作,但是要获得文件的BOM,我发现的唯一解决方案是在FileStream中重新加载相同的文件。我想避免这种情况,因为TStrings.LoadFromFile()
已经获得了BOM。
如何告诉助手重新使用已经找到的BOM?
unit TestEncodingName_00;
interface
uses
Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls, ExtDlgs;
type
TForm1 = class(TForm)
Memo1: TMemo;
procedure FormCreate(Sender: TObject);
private
{ Private declarations }
public
{ Public declarations }
end;
TMyStrings = class helper for TStrings // emulate TStrings.Encoding
private
function GetEncodingName(fPath:string):string;
public
property EncodingName[fPath:string]:string read GetEncodingName;
end;
var
Form1: TForm1;
implementation
{$R *.dfm}
function TMyStrings.GetEncodingName(fPath:string):string;
var
fLen : integer;
fBuffer : TBytes;
fEncoding : TEncoding;
fName : string;
fFs : TFileStream;
begin
fFs := TFileStream.Create(fPath, fmOpenRead);
try
SetLength(fBuffer, 4);
flen := fFs.Read(fBuffer[0], 4);
if flen < 4 then
SetLength(fBuffer, flen);
fEncoding := nil;
TEncoding.GetBufferEncoding(fBuffer, fEncoding);
if fEncoding = TEncoding.Unicode then
fName := 'Unicode'
else if fEncoding = TEncoding.UTF8 then
fName := 'UTF8'
else fName := 'Default';
finally
fFs.Free;
end;
result := fName;
end;
procedure TForm1.FormCreate(Sender: TObject);
var
EncName : string;
begin
(* sample UTF8.txt
Ā ā Ă ă
Ρ Σ Τ Υ
ぁ あ ぃ
*)
Memo1.Lines.LoadFromFile('Sample UTF8.txt');
//from here TStrings knows the BOM but I don't know
// how to refer to it...
// so I have to create again a stream of the same file to
// get the BOM. I don't like that.
EncName := Memo1.Lines.EncodingName['Sample UTF8.txt'];
Memo1.Lines.Add(#13#10'Encoding : ' + EncName);
end;
end.
最佳答案
首先,是LoadFromStream()
发现BOM表编码,而不是LoadFromFile()
。 LoadFromFile()
只需将文件打开到TFileStream
中,然后调用LoadFromStream()
。
在Delphi(2009和2010)中,发现的BOM编码不会存储在您可以访问的任何位置。这就是XE通过添加新的Encoding
属性解决的问题。在解析之前将文件数据解码为LoadFromStream()
时,该编码仅用作UnicodeString
内部的局部变量,然后在LoadFromStream()
退出时被丢弃。您无能改变这种行为。
因此,唯一的解决方案是手动加载文件,以便您发现其BOM。理想情况下,您将在后代类中覆盖LoadFromStream()
,但是不能使TMemo.Lines
使用自定义类。 class helper
也不能覆盖虚拟方法。
但是,您可以从TStringList
派生自定义类以覆盖LoadFromStream()
,自己加载文件,然后将Assign()
从TStringList
到TMemo.Lines
。例如:
unit TestEncodingName_00;
interface
uses
Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls, ExtDlgs;
type
TForm1 = class(TForm)
Memo1: TMemo;
procedure FormCreate(Sender: TObject);
private
{ Private declarations }
public
{ Public declarations }
end;
TMyStringList = class(TStringList)
private
fEncoding: TEncoding;
public
{ The single-parameter LoadFromStream(Stream: TStream) simply
calls LoadFromStream(Stream: TStream; Encoding: TEncoding) with
the Encoding parameter set to nil, so you only have to override
that version of LoadFromStream()... }
procedure LoadFromStream(Stream: TStream; Encoding: TEncoding); override;
property Encoding: TEncoding read fEncoding;
end;
var
Form1: TForm1;
implementation
{$R *.dfm}
procedure TMyStringList.LoadFromStream(Stream: TStream; Encoding: TEncoding);
var
Size: Integer;
Buffer: TBytes;
begin
{ this is similar to the implementation that LoadFromStream()
uses in XE+, but with some differences:
1. the Encoding property is assigned a bit differently, as XE+
utilizes a TEncoding.Clone() method when the specified Encoding
is not a standard RTL encoding (ie, is a custom user class), but
Clone() does not exist in D2009/2010.
2. XE+ has a TStrings.DefaultEncoding property, which is passed
to TEncoding.GetBufferEncoding() as the default to return if no
BOM is detected, but that property and parameter do not exist in
D2009/2010.
3. TStrings.LoadFromStream() does not check if Size is 0 (file is empty)
before dereferencing the Buffer that is passed to Stream.Read().
That is a runtime crash waiting to happen! }
BeginUpdate;
try
Size := Stream.Size - Stream.Position;
SetLength(Buffer, Size);
if Size > 0 then
Stream.Read(Buffer[0], Size);
Size := TEncoding.GetBufferEncoding(Buffer, Encoding);
fEncoding := Encoding;
SetTextStr(Encoding.GetString(Buffer, Size, Length(Buffer) - Size));
finally
EndUpdate;
end;
end;
procedure TForm1.FormCreate(Sender: TObject);
var
EncName : string;
List: TMyStringList;
begin
List := TMyStringList.Create;
try
List.LoadFromFile('Sample UTF8.txt');
if List.Encoding = TEncoding.Unicode then
EncName := 'Unicode'
else if List.Encoding = TEncoding.UTF8 then
EncName := 'UTF8'
else
EncName := 'Default';
Memo1.Lines.Assign(List);
Memo1.Lines.Add;
Memo1.Lines.Add('Encoding : ' + EncName);
finally
List.Free;
end;
end;
end.
关于delphi - Delphi 2010:如何模拟Delphi XE TStrings.Encoding属性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45650331/
基本上我有(州,州代码)对,它们是国家的子集[美国] -> [VT] -> 32 所以我正在使用 std::map>但是我在分配州代码时遇到了问题 for(std::map>::const_itera
如何检查 TStrings 中是否存在特定字符串?例如,我有包含大量文本的 TString,我想检查字符串是否为“Hello!”出现在本文中。 “你好!”只是一个示例字符串。它可以是任何东西。字符串可
我有一个从 TFrame 扩展的对象。这包含一个 TCombobox。 我想确保当我的框架被破坏时释放任何关联的对象。然而,当我的析构函数运行时,我可以访问组合框,但它的项目已被清除。 这会做什么?我
我最近发现了这段代码,我一直在尝试修改它,但没有运气。我如何修改代码,以便它不仅接受文件,还接受 TStrings? 只能这样使用 TMultiStringList.LoadFromFile('som
我编写了一个类似 TListBox 的控件(类似于 Doctor Bob's SpeedBox )。 它运行良好,但有一个问题除外:分配给属性 Items 的字符串在启动时不会加载到 TListBox
我需要搜索一大组数据文件。我想查找包含字符串“foo\tbar\tboo”的文件。我试过这个... $ find . -name "foo*dat" -exec grep foo {} \; | le
我在尝试为自己输入一个方便的 tstring 时遇到问题(见下文) #ifndef _NISAMPLECLIENT_H_ #define _NISAMPLECLIENT_H_ #include #i
以下代码有效: var SL: TStrings; begin SL := TStringList.Create; try SL.Add(Format('%s=%s', ['Ale
我有一个文件.\input.txt,如下所示: aaa bbb ccc 如果我使用 TStrings.LoadFromFile 阅读它并使用 TStrings.SaveToFile 将其写回(即使不应
为什么变量声明为 TStrings 并创建为 TStringList? 例如:var sl 被声明为 TStrings 但创建为 TStringList var sl : TStrings; be
在 Delphi XE7 中,我使用 Anders Melander 著名的 DragAndDropSuite。该套件中的 TDropFileTarget 组件将删除的文件作为 TUnicodeStr
好吧,这变得很傻了...... 这是第二次(第一次是在 30 分钟前,在一个获取目录树的函数上)我曾经看到错误“抽象错误”,真的不知道为什么会发生。 我有这个功能,列出所有的硬盘: function
在 Delphi 7 中,我使用 TCheckListBox。我希望它使用 TStringList 而不是 TStrings,因此我可以将重复项设置为 dupIgnore,并将排序设置为 TRUE。
有人可以帮我解释为什么当底层函数中引发异常时 TStrings 会作为“不可访问的值”返回吗? function GetStrings():TStrings; begin result := TS
我正在尝试将 LPTSTR 变量转换为 tstring(即,unicode 应用程序中的 wstring 和 ANSI 中的字符串)。 我如何执行此转换? 我的代码尝试执行转换,但它导致错误:“调试断
Delphi XE在Encoding类中添加了TStrings属性,该属性存储在调用LoadFromFile()时从BOM表读取的编码。 Delphi 2010没有此属性。 我想效仿它。 我为TStr
我有字符串'AAA'+#$0d+#$0a+'BBB'+#$01d+'CCC'。我需要根据 #$1d 字符进行分割,例如: 'AAA'+#$0d+#$0a+'BBB' 'CCC' 我正在使用函数: pr
我在 WCP 1252 编码的头文件中有一个字符串: #define MY_STR "This string has some fancy characters like ©" 我如何使用像 UTF-
我饶有兴趣地阅读了 Nick Hodges 的博客 Why You Should Be Using Interfaces由于我已经爱上了编码中更高级别的接口(interface),因此我决定研究如何将
为什么Memo.Lines使用抽象类TStrings?为什么不使用 TStringList 来代替? 我应该在使用它之前将其转换为 TStringList 吗? 最佳答案 TMemo.Lines、TL
我是一名优秀的程序员,十分优秀!