- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我现在正在编写一个生成文件的程序。我想知道关于 Stream(s) 的最佳实践是什么,尤其是在大小方面?我可以想象,如果一个流变得太大,它会带来一些减速或其他性能问题。
我有以下代码,可以调用很多次,而且集合可能很大。我认为对于不同的大小应该有不同的表现,比如 <1MB <=> 10MB <=> 100MB <=> 到 1-10GB <=>>10GB
writeIntoStream: anInputStringCollection
aWriteStream := WriteStream on: '' asUnicode16String.
anInputStringCollection do: [ :string |
aWriteStream nextPutAllUnicode: string asUnicode16String.
].
^ aWriteStream
最佳做法是什么?例如,是否应该关心它适合堆还是堆栈?
目前我得出的结论是,如果我对流(或集合)使用最大 5kB,它就足够快并且可以工作(对于 Smalltalk/X)。
我想知道不同 Smalltalk 风格的限制和内部结构。 (我没有进行任何测试,也找不到任何关于它的文章)
编辑:首先感谢大家(@LeandroCaniglia、@JayK、@aka.nice)。第一个版本是——速度变慢是由许多操作引起的:打开、写入、关闭。逐行写:
write: newString to: aFile
"Writes keyName, keyValue to a file"
"/ aFile is UTF16-LE (Little Endian) Without Signature (BOM)
aFile appendingFileDo: [ :stream |
stream nextPutAllUtf16Bytes: newString MSB: false
]
第二个版本,速度更快但仍然不正确。有一个以 block 的形式写入的中间流是:
write: aWriteStream to: aFile
"Writes everything written to the stream"
"/ aFile is UTF16-LE Without Signature
aFile appendingFileDo: [ :stream | "/ withoutTrailingSeparators must be there as Stream puts spaces at the end
stream nextPutAllUtf16Bytes: (aWriteStream contents withoutTrailingSeparators) MSB: false
]
在 Leandro 的回答和您的建议之后的第三个版本(我查看了缓冲区 - 大小定义为 __stringSize(aCollection)
当可用缓冲区/内存耗尽时,然后将其写入文件。我一起删除了 #write:to:
现在流定义为:
anAppendFileStream := aFile appendingWriteStream。
流中播放的每个方法现在都使用:
anAppendFileStream nextPutUtf16Bytes:aCharacter MSB:false。
或
anAppendFileStream nextPutAllUtf16Bytes:字符串 MSB:false
有缓冲区大小逻辑,其中缓冲区长度的猜测发生在例如#nextPutAll:
- bufLen = (sepLen == 1) ? len : (len + ((len/4) + 1) * sepLen);)
,其中 sepLen
是根据分隔符大小(EOF、cr、crlf)定义的。
不同的方法可能有不同的缓冲区大小,例如#copyToEndFrom:
- 对于 Windows:bufferSize := 1 * 1024
或 *nix bufferSize := 8 * 1024
[kB].
最佳答案
您要求的是最佳实践,因此在这方面我会说最佳实践是将数据转储到流中,而不管特定流是否与文件相关联。在你的情况下,这意味着你不应该在到达磁盘上的真实流之前使用中间流。
现在,鉴于您遇到的性能问题,我的建议是更好地了解问题的原因,而不是像您正在尝试的那样寻找解决方法。
在流的情况下,nextPutAll:
操作执行不佳的主要原因是特定消息的特殊风格,nextPutAllUnicode:
在您的情况下,没有利用特定流类中内置的优化。
更准确地说,大多数流通过在一次操作中转储数据参数来优化 nextPutAll:
(和 friend )。这通常比语义等效的迭代快得多:
data do: [:token | stream nextPut: token]
这不仅发送的消息比单个操作优化多得多,而且还加剧了 FFI 等所花费的时间。
因此,为了给您一些行动方面的提示,我的建议是调试代码并查看为什么 nextPutAllUnicode:
没有被优化,并在理解了这一点后更改您的代码,以便它将允许单个操作发生。
关于smalltalk - 最佳流大小(ReadStream、WriteStream 等),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55706742/
我正在整理一个 NLP 实验,其中概念是一个系统中的代理,旨在产生由新概念组成的 Emergent 属性(here's a link 对于那些不知道 Emergence 是什么的人)。 Smallta
我是 Smalltalk 的新手。我已经阅读了一些关于它的文章和文档,我对它概念的完整性感到惊讶。它提供了某种实时调试。 不管怎样,对于程序错误,错误意味着程序逻辑错误,程序累积的所有突变都是无效的。
我经常读到 Smalltalk 中的“图像生成”过程。该过程似乎是指从 Smalltalk 内部从头开始创建图像。 但是还有一个“剥离”过程,它似乎涉及删除对象以部署运行时。 两者有什么区别?有支持图
我需要生成 N 个数字的所有可能组合包括重复。 问题输入:我有 N 个单元格,每个单元格中我可以在 0 到:9 之间输入一个数字。 错误的解决方案(N = 4): (0 to: 3) permutat
考虑 Juicer 中的以下方法类(class): Juicer >> juiceOf: aString | fruit juice | fruit := self gather: a
Array extend [ Array class >> bin: val left: l right: r [ ^ super binSearch: val left: l ri
我想知道,如果我定义一个新的类变量,例如为类 MyClass , 定义将在 MyClass 中或在 MyClass class ?是否MyClass class甚至知道新的类变量? 最佳答案 是的,类
我想知道一个类(或对象)的生命周期是什么,我的意思是,当它进入内存并活着回答消息直到最终从内存中删除时。 我的假设是: 由于您向对象和类发送消息,因此它们必须处于事件状态并在内存中才能回答它们 当您通
我记得在某处看到过一个方法,它实际上只允许名称中的字母“大写”、“小写”、数字和下划线,但我一生都找不到它。 是否允许任何其他字符? 最佳答案 如果您想检查选择器名称中允许使用哪些字符,您可以使用 R
除了尺寸。 例如: |arr|. arr := Array new: 10 和 #(element1,element2, ...) 最佳答案 在这两种形式中,创建的对象将具有相同的类型和相同的元素。主
至少在 Squeak 和 Pharo 中,每个类都有其相应的元类,它保存该类的类方法。每个 Smalltalk 都是这样吗? 最佳答案 根据Wikipedia article on Smalltalk
Cincom Smalltalk VisualWorks 7.10 中的字体无法在配备 Retina 显示屏的 MacBook Pro 上以高分辨率显示。将文本大小设置为“大”并不能解决问题。屏幕默认
我需要帮助理解 Smalltalk 中变量的用法和差异。下面给定代码中每个变量的区别和用法是什么? Object subclass: #MyClass instanceVariableNames:
我正在尝试使用smalltalk smalltalk/x-jv branch 。我有以下简单的代码: Object subclass: Myclass[ |mainval| init
1) string 和 string literal 有什么区别 2) 一本书说 'zero' at: 1 put: $h 会失败,因为文字是不可变的,但如果我执行 'zero' copy at: 1
我正在尝试学习一些 smalltalk 编程.... 我正在尝试创建一个 myClass 类型的对象列表。做到这一点的最佳方法是什么? 我有以下几点: | list | list := Ordered
我已经关注了这个以前的线程 How to manage 2d array in Smalltalk? 但它没有帮助我,请帮帮我。 我正在尝试创建 NXN 数组,然后将它们打印出来。 例如 2x2 阵列
我有一个点列表,必须进行腐 eclipse /膨胀操作。我需要一种二维数组,但在 VisualWorks 中找不到方法(我知道 Squeak 中有一个 Array2d 类,但我必须使用 VW)。 最佳
我正在我的 Pharo 图像中构建一个博客条目查看器和编辑器应用程序,条目内容被格式化为 Smalltalk 代码(Seaside 标记 API 非常好)。我是 Smalltalk 的新手,所以我使用
关闭。这个问题需要details or clarity .它目前不接受答案。 想改善这个问题吗?通过 editing this post 添加详细信息并澄清问题. 4年前关闭。 Improve thi
我是一名优秀的程序员,十分优秀!