- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这是交易。我的应用程序有很多线程执行相同的操作 - 从大文件(> 2GB)中读取特定数据,解析数据并最终写入该文件。
问题是,有时可能会发生一个线程从文件 A 中读取 X,而第二个线程写入同一文件 A 的 X 的情况。会出现问题吗?
I/O 代码对每个文件使用 TFileStream。我将I/O代码拆分为本地(静态类),因为我担心会有问题。既然是拆分的,就应该有关键部分。
下面的每个案例都是未实例化的本地(静态)代码。
案例1:
procedure Foo(obj:TObject);
begin ... end;
案例2:
procedure Bar(obj:TObject);
var i: integer;
begin
for i:=0 to X do ...{something}
end;
案例3:
function Foo(obj:TObject; j:Integer):TSomeObject
var i:integer;
begin
for i:=0 to X do
for j:=0 to Y do
Result:={something}
end;
问题 1:在什么情况下我需要临界区,这样如果 >1 个线程同时调用它就不会出现问题?
问题2:如果线程1从文件A读取X(entry),而线程2向文件A写入X(entry),会出现问题吗?
什么时候应该使用临界区?我试着用我的头脑想象它,但这很难——只有一根线:))
编辑
这适合吗?
{每个 2GB 文件一个类}
TSpecificFile = class
cs: TCriticalSection;
...
end;
TFileParser = class
file :TSpecificFile;
void Parsethis; void ParseThat....
end;
function Read(file: TSpecificFile): TSomeObject;
begin
file.cs.Enter;
try
...//read
finally
file.cs.Leave;
end;
end;
function Write(file: TSpecificFile): TSomeObject;
begin
file.cs.Enter;
try
//write
finally
file.cs.Leave
end;
end;
现在如果两个线程调用 Read 会出现问题:
情况1:相同的TSpecificFile
情况2:不同的TSpecificFile?
我需要另一个关键部分吗?
最佳答案
一般来说,只要多个线程可以同时访问共享资源,并且至少有一个线程会写入/修改共享资源,就需要一种锁定机制(临界区是一种锁定机制)。< br/>无论资源是内存中的对象还是磁盘上的文件,都是如此。
之所以需要加锁,是因为如果读操作与写操作同时发生,则读操作很可能获得不一致的数据,从而导致不可预测的行为。
Stephen Cheung 提到了有关文件处理的平台特定注意事项,我在此不再重复。
As a side note, I'd like to highlight another concurrency concern that may be applicable in your case.
- Suppose one thread reads some data and starts processing.
- Then another thread does the same.
- Both threads determine that they must write a result to position X of File A.
- At best the values to be written are the same, and one of the threads effectively did nothing but waste time.
- At worst, the calculation of one of the threads is overwritten, and the result is lost.
You need to determine whether this would be a problem for your application. And I must point out that if it is, just locking the read and write operations will not solve it. Furthermore, trying to extend the duration of the locks leads to other problems.
是的,您可以使用关键部分。
我还将建议您在解决方案中考虑另外 2 个工具。
这句话说得多么令人震惊!但说实话,如果您使用多线程的原因是“让应用程序更快”,那么您使用多线程的原因就错误。大多数这样做的人实际上最终会让他们的应用程序变得更难编写、更不可靠并且速度更慢!
认为多线程可以加速应用程序是一个非常常见的误解。如果一个任务需要 X 个时钟周期来执行 - 它将需要 X 个时钟周期!多个线程不会加速任务,它允许并行完成多个任务。但这可能是一件坏事! ...
您将您的应用程序描述为高度依赖于从磁盘读取、解析读取的内容以及写入磁盘。根据解析步骤的 CPU 密集程度,您可能会发现所有线程都将大部分时间用于等待磁盘 IO 操作。在这种情况下,多个线程通常仅用于将磁盘头分流到(嗯圆形)磁盘盘片的远“角”。磁盘 IO 仍然是瓶颈,线程使其表现得好像文件最大程度地碎片化一样。
假设您采用多线程的原因是有效的,并且您仍然有线程在共享资源上运行。您可以将共享资源操作排队到特定线程上,而不是使用锁来避免并发问题。
所以代替线程 1:
创建另一个线程; FileA 线程:
关于multithreading - 我什么时候应该使用临界区?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5361127/
我有2个功能: function func1() while true do -- listen on connection end end function func2()
我的问题可能看起来很奇怪,但我想我正面临着 volatile 的问题。对象。 我写了一个这样实现的库(只是一个方案,不是真正的内容): (def var1 (volatile! nil)) (def
由于 maven 支持多线程构建,是否可以同时运行 Sonar 多线程? (例如 mvn sonar:sonar -T 4 ) 我运行了它,当模块报告成功时,它报告整个构建失败并返回 java.uti
我们正在启动一个网站,该网站在短时间内的交易量非常大。它基本上是在给票。该代码是用Java,Spring和Hibernate编写的。我想通过产生多个线程并尝试使用JUnit测试用例来获取票证来模仿高容
我正在尝试访问像素数据并将图像从游戏中的相机保存到磁盘。最初,简单的方法是使用渲染目标,然后使用RenderTarget-> ReadPixels(),但是由于ReadPixels()的 native
我们有以下系统: 用户数:〜500k 项目数:〜100k UserSimilarity userSimilarity = new TanimotoCoefficientSimilarity(dataM
也许这是一个经常出现的问题,但我需要根据我的上下文进行一些自定义。 我正在使用 Spring Batch 3.0.1.RELEASE 我有一个简单的工作,有一些步骤。一个步骤是这样的 block :
也许这是一个经常出现的问题,但我需要根据我的上下文进行一些自定义。 我正在使用 Spring Batch 3.0.1.RELEASE 我有一个简单的工作,有一些步骤。一个步骤是这样的 block :
我正在尝试使用PyBrain和Python的multiprocessing软件包在Python中训练神经网络。 这是我的代码(它训练了一个简单的神经网络来学习XOR逻辑)。 import pybrai
我有一个繁重的功能,不适合在主时间轴上执行(因为要花很长时间才能完成并使程序崩溃)。 因此我在air(as3)中搜索多线程,但是我发现的所有示例都说明了如何在worker中运行单独的swf文件。如何在
我想实现线程A 和线程B 并行运行并共享全局变量。 下面是用python编写的代码。我想在中执行相同操作Dart (我不想使用future等待,因为它正在等待其他线程完成或必须等待。) 大小写变量:
我的一个项目只适用于调试 DLL,而不适用于非调试 DLL。 在 Debug DLL 设置下发布项目有哪些注意事项?例如,是否丢失了某些优化? 如何通过将调试版本设置为非调试 DLL 来调试此项目?我
我正在尝试比较 Matlab 和 Julia 之间的速度和性能。我正在查看一个代码,该代码对承受给定负载的连续体结构进行拓扑优化。我正在查看的代码是公共(public)代码topopt88.m:htt
Serving Flask 应用程序“服务器”(延迟加载) 环境:生产警告:这是一个开发服务器。不要在生产部署中使用它。请改用生产 WSGI 服务器。 Debug模式:开启 在 http://0.0.
我对 PyQT 很陌生。我正在学习如何制作 Progressbar 并随着算法的进展对其进行更新。我已经能够制作一个使用此链接进行 self 更新的基本进度条:Python pyqt pulsing
我正在尝试指定在特定线程上运行任务,这样我就可以使用两个专用于“放入” channel 的耗时任务的线程,而其他线程则用于处理该任务。 我对如何将特定任务分配给特定线程感到困惑。我以为我可以使用类似
我正在编写一个软件,它对很多(潜在的大)图像进行大量图像操作/合成。 多线程有助于提高速度,但 QT 不允许同时在同一图像上使用多个 QPainter。 所以我必须在副本的每个线程中进行图像操作/合成
此脚本读取 url 文件以执行多线程 HTTP 请求。 如何使用带有 url 的数组来发出多线程请求? 我的阵列将有类似的东西: @array = ("https://example.com/xsd"
Java 文档声明了以下关于构造函数同步的内容: Note that constructors cannot be synchronized — using the synchronized keyw
我有一个程序,其中主线程创建了很多线程。它崩溃了,我正在调试核心文件。崩溃发生在其中一个子线程中。为了找到原因,我需要知道主线程是否还活着。有什么方法可以找出哪个线程是初始线程? 最佳答案 Is th
我是一名优秀的程序员,十分优秀!