gpt4 book ai didi

ruby - Ruby Array#[]= 预分配数组的线程安全吗?这可以无锁吗?

转载 作者:数据小太阳 更新时间:2023-10-29 07:37:45 34 4
gpt4 key购买 nike

我已经用 ruby​​ 编写了一些代码来通过线程池处理数组中的项目。在此过程中,我预先分配了一个与传入数组大小相同的结果数组。在线程池中,我在预分配数组中分配项目,但保证这些项目的索引是唯一的。考虑到这一点,我是否需要用 Mutex#synchronize 围绕赋值?

例子:

SIZE = 1000000000
def collect_via_threadpool(items, pool_count = 10)
processed_items = Array.new(items.count, nil)
index = -1
length = items.length
mutex = Mutex.new
items_mutex = Mutex.new
[pool_count, length, 50].min.times.collect do
Thread.start do
while (i = mutex.synchronize{index = index + 1}) < length do


processed_items[i] = yield(items[i])
# ^ do I need to synchronize around this? `processed_items` is preallocated

end
end
end.each(&:join)
processed_items
end

items = collect_via_threadpool(SIZE.times.to_a, 100) do |item|
item.to_s
end

raise unless items.size == SIZE

items.each_with_index do |item, index|
raise unless item.to_i == index
end

puts 'success'

(此测试代码运行时间较长,但似乎每次都打印'success'。)

为了安全起见,我似乎想用 Mutex#synchronize 包围 Array#[]=,但我的问题是:

在 Ruby 规范中这段代码是否被定义为安全的?

最佳答案

除了 Mutex 之外,Ruby 没有指定是线程安全的(因此从它派生的任何东西)。如果您想知道您的特定代码是否是线程安全的,您需要查看您的实现如何处理线程和数组。

对于 MRI,调用 Array.new(n, nil) 实际上会为整个数组分配内存,因此如果保证您的线程不共享索引,您的代码就可以正常工作。它与让多个线程在没有互斥量的情况下对不同变量进行操作一样安全。

但是对于其他实现,Array.new(n, nil) 可能不会分配整个数组,稍后分配给索引可能涉及重新分配和内存复制,这可能会造成灾难性的中断。

因此,尽管您的代码可能有效(至少在 MRI 中),但不要依赖它。当我们谈到这个主题时,甚至没有指定 Ruby 的线程实际并行运行。因此,如果您因为认为可能会看到一些性能提升而试图避免使用互斥锁,那么也许您应该重新考虑您的方法。

关于ruby - Ruby Array#[]= 预分配数组的线程安全吗?这可以无锁吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26611933/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com