smalltalk - 最佳流大小(ReadStream、WriteStream 等)-6ren

smalltalk - 最佳流大小(ReadStream、WriteStream 等)

转载作者：行者123 更新时间：2023-12-01 12:06:53

25

4

我现在正在编写一个生成文件的程序。我想知道关于 Stream(s) 的最佳实践是什么，尤其是在大小方面？我可以想象，如果一个流变得太大，它会带来一些减速或其他性能问题。

我有以下代码，可以调用很多次，而且集合可能很大。我认为对于不同的大小应该有不同的表现，比如 <1MB <=> 10MB <=> 100MB <=> 到 1-10GB <=>>10GB

writeIntoStream: anInputStringCollection 

aWriteStream := WriteStream on: '' asUnicode16String.
anInputStringCollection do: [ :string |
    aWriteStream nextPutAllUnicode: string asUnicode16String.
].

^ aWriteStream

最佳做法是什么？例如，是否应该关心它适合堆还是堆栈？

目前我得出的结论是，如果我对流(或集合)使用最大 5kB，它就足够快并且可以工作(对于 Smalltalk/X)。

我想知道不同 Smalltalk 风格的限制和内部结构。 (我没有进行任何测试，也找不到任何关于它的文章)

编辑:首先感谢大家(@LeandroCaniglia、@JayK、@aka.nice)。第一个版本是——速度变慢是由许多操作引起的:打开、写入、关闭。逐行写:

write: newString to: aFile
    "Writes keyName, keyValue to a file"

    "/ aFile is UTF16-LE (Little Endian) Without Signature (BOM)
    aFile appendingFileDo: [ :stream | 
        stream nextPutAllUtf16Bytes: newString MSB: false
    ]

第二个版本，速度更快但仍然不正确。有一个以 block 的形式写入的中间流是:

write: aWriteStream to: aFile
    "Writes everything written to the stream"

    "/ aFile is UTF16-LE Without Signature
    aFile appendingFileDo: [ :stream | "/ withoutTrailingSeparators must be there as Stream puts spaces at the end
        stream nextPutAllUtf16Bytes: (aWriteStream contents withoutTrailingSeparators) MSB: false
    ]

在 Leandro 的回答和您的建议之后的第三个版本(我查看了缓冲区 - 大小定义为 __stringSize(aCollection) 当可用缓冲区/内存耗尽时，然后将其写入文件。我一起删除了 #write:to: 现在流定义为:

anAppendFileStream := aFile appendingWriteStream。

流中播放的每个方法现在都使用:

anAppendFileStream nextPutUtf16Bytes:aCharacter MSB:false。

或

anAppendFileStream nextPutAllUtf16Bytes:字符串 MSB:false

至于缓冲区大小本身:

有缓冲区大小逻辑，其中缓冲区长度的猜测发生在例如#nextPutAll: - bufLen = (sepLen == 1) ? len : (len + ((len/4) + 1) * sepLen);)，其中 sepLen 是根据分隔符大小(EOF、cr、crlf)定义的。

不同的方法可能有不同的缓冲区大小，例如#copyToEndFrom: - 对于 Windows:bufferSize := 1 * 1024 或 *nix bufferSize := 8 * 1024 [kB].

最佳答案

您要求的是最佳实践，因此在这方面我会说最佳实践是将数据转储到流中，而不管特定流是否与文件相关联。在你的情况下，这意味着你不应该在到达磁盘上的真实流之前使用中间流。

现在，鉴于您遇到的性能问题，我的建议是更好地了解问题的原因，而不是像您正在尝试的那样寻找解决方法。

在流的情况下，nextPutAll: 操作执行不佳的主要原因是特定消息的特殊风格，nextPutAllUnicode: 在您的情况下，没有利用特定流类中内置的优化。

更准确地说，大多数流通过在一次操作中转储数据参数来优化 nextPutAll:(和 friend )。这通常比语义等效的迭代快得多:

data do: [:token | stream nextPut: token]

这不仅发送的消息比单个操作优化多得多，而且还加剧了 FFI 等所花费的时间。

因此，为了给您一些行动方面的提示，我的建议是调试代码并查看为什么 nextPutAllUnicode: 没有被优化，并在理解了这一点后更改您的代码，以便它将允许单个操作发生。

关于smalltalk - 最佳流大小(ReadStream、WriteStream 等)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55706742/

25

4

0

文章推荐： c++ - 为浮点常量调用伪析构函数的有效语法

文章推荐： c++ - 继承模板转换运算符

文章推荐： java - Apache Storm - 从 Config 读取 YAML 列表

c - 大小(数组)/大小(整数)
这个问题在这里已经有了答案: C sizeof a passed array [duplicate] (7 个回答) 8年前关闭。在一个函数中，我声明了一个数组: int char_count_ar
linux - 为什么文件系统有自己的 block 大小，而不是使用硬盘 block 大小？
简而言之，文件系统如何与 block 设备通信？最佳答案我对 block 大小不太了解。我认为 ext4(Linux)的文件系统的 block 大小是 4KB，考虑到现代处理器的页面大小(4KB)
mysql - tinyint(大小)，varchar(大小): "size" explaination
我知道 tinyint(1) 和 tinyint(2) 具有相同的存储空间范围。唯一的区别是显示宽度不同。这是否意味着 tinyint(1) 将存储所有类型的整数但只正确显示 0 到 9 的范围？而
c++ - 大小 8 的无效读取，大小 8 的无效写入 (Valgrind)
今晚我已经研究了以下代码几个小时，但我只是摸不着头脑。当使用函数从标准输入填充数组时，我不断收到“大小 8 的无效写入”和“大小 8 的无效读取”。如有任何帮助，我们将不胜感激...我知道 Sta
c - 大小 8 的无效读取，大小 8 的无效写入，C
我有一个 valgrind 错误，我不知道如何摆脱它们: ==5685== Invalid read of size 8 ==5685== at 0x4008A1: main (in /home
Hadoop block 大小 vs 拆分 vs block 大小
我对 Hadoop 的概念有点困惑。 Hadoop block 大小、拆分大小和 block 大小之间有什么区别？提前致谢。最佳答案 block 大小和 block 大小相同。拆分大小可能与
javascript - 超过 localStorage 配额(localStorage 大小!= 文件下载大小)& 如何检查 localStorage 大小
我想不出一个好的标题，所以希望可以。我正在做的是创建一个离线 HTML5 webapp。 “出于某些原因”我不希望将某些文件放在缓存 list 中，而是希望将内容放在 localStorage 中。
xamarin - 减少 Xamarin.Forms 中的 APK 大小，APK 大小 80MB
无法将 xamarin apk 大小减少到 80 MB 以下，已执行以下操作: 启用混淆器配置:发布平台:事件(任何 CPU)。启用 Multi-Dex:true 启用开发人员检测(调试和分析)
python - 读取多个 csv 文件(大小 mxm)并加载为 n 维数组(大小 nxmxm)(不连接)
我正在开发一个程序，需要将大量 csv 文件(数千个)加载到数组中。 csv 文件的尺寸为 45x100，我想创建一个尺寸为 nx45x100 的 3-d 数组。目前，我使用 pd.read_csv(
react-native - Flutter apk/ipa 大小 vs React Native apk/ipa 大小
Hello World 示例的 React Native APK 大小约为 20M (in recent versions)，因为支持不同的硬件架构(ARMv7、ARMv8、X86 等)，而同一应用程
python - 将 n 个元素(大小 = 2 字节，十进制)的列表拆分为 2n 个元素(大小 = 1 字节，十六进制)
我有一个包含 n 个十进制元素的列表，其中每个元素都是两个字节长。可以说: x = [9000 , 5000 , 2000 , 400] 这个想法是将每个元素拆分为 MSB 和 LSB 并将其存储在
GtkTextView 大小
如何设置 GtKTextView 的大小？我想我不能使用 gtk_widget_set_usize。最佳答案您不能直接控制小部件的大小，而是由其容器完成。您可以使用 gtk_widget_set_
具有函数的结构的c++大小
这个问题在这里已经有了答案: c++ sizeof() of a class with functions (7 个答案) 关闭 5 年前。结果是 12。 foobar 函数存储在内存中的什么位置
image - 为什么图像序列比源视频大(大小)？
当我在 ffmpeg(或任何其他程序)中使用这样的命令时: ffmpeg -i input.mp4 image%d.jpg 所有图像的组合文件大小总是比视频本身大。我尝试减少每秒帧数、降低压缩设置、模
clojurescript 高级编译 - 大小
我是 clojurescript 的新手。高级编译后出现“77 KB”的javascript文件是否正常？我有一个 clojurescript 文件: 我正在使用 leinigen: lein c
Qt QPixmap 大小
我想要一个 QPixmap尺寸为 50 x 50。我试过 : QPixmap watermark(QSize(50,50)); watermark.load(":/icoMenu/preparati
卷积层的 tensorflow 大小
我正在尝试从一篇研究论文中重新创建一个 cnn，但我对深度学习还是个新手。我得到了一个大小为 32x32x7 的 3d 补丁。我首先想执行一个大小为 3x3 的卷积，具有 32 个特征和步幅为 2。
iPhone如何在旋转设备时正确调整 View 大小
我一直在尝试调整 View Controller 内的 View 大小，但到目前为止没有运气。基本上，我的 View 最底部有一个按钮，当方向从纵向更改为横向时，该按钮不再可见，因为它现在太靠下了。
javascript - 上传前检查图像尺寸/大小
如何使用此功能检查图像的尺寸？我只是想在上传之前检查一下... $("#LINK_UPLOAD_PHOTO").submit(function () { var form = $(this);
二叉搜索树上的 JavaScript 大小
我用 C++ 完成了这个，因为你可以通过引用传递参数。我无法弄清楚如何在 JavaScript 中执行此操作。我的代码需要更改什么？我的输出是1 this.sizeOfBst = function()

首页

博学

6Ren·AI

商城

smalltalk - 最佳流大小(ReadStream、WriteStream 等)

至于缓冲区大小本身: