- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我需要在内存中保留文档的表示形式,并且正在寻找最有效的方法来执行此操作。
假设
当前的考虑
对于这种事情必须有大量的标准算法(这不是一百万英里的磁盘分配和碎片化)。
谢谢你的想法。
最佳答案
我建议将文件分成 block 。所有 block 在加载时都具有相同的长度,但如果用户编辑此 block ,每个 block 的长度可能会改变。如果用户在前面插入一个字节,这将避免移动 100 兆字节的数据。
要管理 block ,只需将它们 - 连同每个 block 的偏移量 - 放入列表中。如果用户修改了一个 block 的长度,你必须只更新这个 block 之后的 block 的偏移量。要查找偏移量,您可以使用二进制搜索。
文件大小:100 MiB
block 大小: 16 kiB
block :6400
使用二进制搜索查找偏移量(最坏情况): 13 个步骤
修改 block (最坏情况):复制16384字节数据并更新6400个 block 偏移量
修改一个 block (一般情况):复制8192字节数据并更新3200个 block 偏移
16 kiB block 大小只是一个随机示例 - 您可以通过选择 block 大小来平衡操作成本,可能基于文件大小和操作概率。做一些简单的数学运算将得出最佳 block 大小。
加载会非常快,因为您加载固定大小的 block ,并且保存也应该表现良好,因为您将不得不写入几千个 block 而不是数百万行。您可以通过仅按需加载 block 来优化加载,您可以通过仅保存所有更改的 block (内容或偏移量)来优化保存。
最终实现也不会太难。您可以只使用 StringBuilder
类来表示一个 block 。但是对于长度与 block 大小相当或更大的非常长的行,此解决方案将无法很好地工作,因为您将不得不加载许多 block 并仅显示一小部分,其余部分位于窗口的左侧或右侧。我假设在这种情况下您将不得不使用二维分区模型。
关于c# - 在内存中保存大型可编辑文档的最佳方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/838712/
我想了解 Ruby 方法 methods() 是如何工作的。 我尝试使用“ruby 方法”在 Google 上搜索,但这不是我需要的。 我也看过 ruby-doc.org,但我没有找到这种方法。
Test 方法 对指定的字符串执行一个正则表达式搜索,并返回一个 Boolean 值指示是否找到匹配的模式。 object.Test(string) 参数 object 必选项。总是一个
Replace 方法 替换在正则表达式查找中找到的文本。 object.Replace(string1, string2) 参数 object 必选项。总是一个 RegExp 对象的名称。
Raise 方法 生成运行时错误 object.Raise(number, source, description, helpfile, helpcontext) 参数 object 应为
Execute 方法 对指定的字符串执行正则表达式搜索。 object.Execute(string) 参数 object 必选项。总是一个 RegExp 对象的名称。 string
Clear 方法 清除 Err 对象的所有属性设置。 object.Clear object 应为 Err 对象的名称。 说明 在错误处理后,使用 Clear 显式地清除 Err 对象。此
CopyFile 方法 将一个或多个文件从某位置复制到另一位置。 object.CopyFile source, destination[, overwrite] 参数 object 必选
Copy 方法 将指定的文件或文件夹从某位置复制到另一位置。 object.Copy destination[, overwrite] 参数 object 必选项。应为 File 或 F
Close 方法 关闭打开的 TextStream 文件。 object.Close object 应为 TextStream 对象的名称。 说明 下面例子举例说明如何使用 Close 方
BuildPath 方法 向现有路径后添加名称。 object.BuildPath(path, name) 参数 object 必选项。应为 FileSystemObject 对象的名称
GetFolder 方法 返回与指定的路径中某文件夹相应的 Folder 对象。 object.GetFolder(folderspec) 参数 object 必选项。应为 FileSy
GetFileName 方法 返回指定路径(不是指定驱动器路径部分)的最后一个文件或文件夹。 object.GetFileName(pathspec) 参数 object 必选项。应为
GetFile 方法 返回与指定路径中某文件相应的 File 对象。 object.GetFile(filespec) 参数 object 必选项。应为 FileSystemObject
GetExtensionName 方法 返回字符串,该字符串包含路径最后一个组成部分的扩展名。 object.GetExtensionName(path) 参数 object 必选项。应
GetDriveName 方法 返回包含指定路径中驱动器名的字符串。 object.GetDriveName(path) 参数 object 必选项。应为 FileSystemObjec
GetDrive 方法 返回与指定的路径中驱动器相对应的 Drive 对象。 object.GetDrive drivespec 参数 object 必选项。应为 FileSystemO
GetBaseName 方法 返回字符串,其中包含文件的基本名 (不带扩展名), 或者提供的路径说明中的文件夹。 object.GetBaseName(path) 参数 object 必
GetAbsolutePathName 方法 从提供的指定路径中返回完整且含义明确的路径。 object.GetAbsolutePathName(pathspec) 参数 object
FolderExists 方法 如果指定的文件夹存在,则返回 True;否则返回 False。 object.FolderExists(folderspec) 参数 object 必选项
FileExists 方法 如果指定的文件存在返回 True;否则返回 False。 object.FileExists(filespec) 参数 object 必选项。应为 FileS
我是一名优秀的程序员,十分优秀!