- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我有一个程序生成 3 个工作线程,这些工作线程执行一些数字运算,并等待它们像这样完成:
#define THREAD_COUNT 3
volatile LONG waitCount;
HANDLE pSemaphore;
int main(int argc, char **argv)
{
// ...
HANDLE threads[THREAD_COUNT];
pSemaphore = CreateSemaphore(NULL, THREAD_COUNT, THREAD_COUNT, NULL);
waitCount = 0;
for (int j=0; j<THREAD_COUNT; ++j)
{
threads[j] = CreateThread(NULL, 0, Iteration, p+j, 0, NULL);
}
WaitForMultipleObjects(THREAD_COUNT, threads, TRUE, INFINITE);
// ...
}
工作线程在代码中的某些点使用自定义 Barrier 函数来等待所有其他线程到达 Barrier:
void Barrier(volatile LONG* counter, HANDLE semaphore, int thread_count = THREAD_COUNT)
{
LONG wait_count = InterlockedIncrement(counter);
if ( wait_count == thread_count )
{
*counter = 0;
ReleaseSemaphore(semaphore, thread_count - 1, NULL);
}
else
{
WaitForSingleObject(semaphore, INFINITE);
}
}
(基于this answer的实现)
程序偶尔会死锁。如果那时我使用 VS2008 来中断执行并在内部进行挖掘,则只有 1 个工作线程在 Barrier()
的 Wait...
行上等待。 waitCount
的值始终为 2。
让事情变得更尴尬的是,线程工作得越快,它们就越有可能死锁。如果我在 Release 模式下运行,10 次中大约有 8 次出现死锁。如果我在 Debug模式下运行并在线程函数中放置一些打印以查看它们挂起的位置,它们几乎不会挂起。
所以看起来我的一些工作线程被提前杀死了,剩下的就卡在了 Barrier 上。然而,线程除了读取和写入内存(并调用 Barrier()
)外几乎什么都不做,而且我非常肯定不会发生段错误。也有可能我得出了错误的结论,因为(如上面链接的问题中所述)我是 Win32 线程的新手。
这里可能发生了什么,我如何使用 VS 调试这种奇怪的行为?
最佳答案
How do I debug weird thread behaviour?
不完全是你说的那样,但答案几乎总是:真正理解代码,理解所有可能的结果并找出正在发生的结果。调试器在这里变得没那么有用了,因为你可以跟随一个线程而错过导致其他线程失败的原因,或者跟随父线程,在这种情况下执行不再是顺序的,你最终会到处都是。
现在,进入问题。
pSemaphore = CreateSemaphore(NULL, THREAD_COUNT, THREAD_COUNT, NULL);
lInitialCount [in]: The initial count for the semaphore object. This value must be greater than or equal to zero and less than or equal to lMaximumCount. The state of a semaphore is signaled when its count is greater than zero and nonsignaled when it is zero. The count is decreased by one whenever a wait function releases a thread that was waiting for the semaphore. The count is increased by a specified amount by calling the ReleaseSemaphore function.
和here :
Before a thread attempts to perform the task, it uses the WaitForSingleObject function to determine whether the semaphore's current count permits it to do so. The wait function's time-out parameter is set to zero, so the function returns immediately if the semaphore is in the nonsignaled state. WaitForSingleObject decrements the semaphore's count by one.
所以我们在这里要说的是,信号量的计数参数告诉您一次允许多少线程执行给定任务。当您最初将计数设置为 THREAD_COUNT
时,您允许所有线程访问“资源”,在这种情况下,该资源将继续向前。
您链接的答案使用信号量的这种创建方法:
CreateSemaphore(0, 0, 1024, 0)
这基本上是说没有线程被允许使用该资源。在您的实现中,信号量被发出信号(>0),因此一切都在愉快地进行,直到其中一个线程设法将计数减少到零,此时其他线程等待信号量再次发出信号,这可能是'不会与您的柜台同步发生。请记住,当 WaitForSingleObject
返回时,它会减少信号量上的计数器。
在您发布的示例中,设置:
::ReleaseSemaphore(sync.Semaphore, sync.ThreadsCount - 1, 0);
之所以有效,是因为每个 WaitForSingleObject 调用都会将信号量的值减 1,并且有 threadcount - 1
需要执行,这发生在 threadcount - 1
WaitForSingleObject
全部返回,所以信号量回到 0,因此再次取消信号,所以在下一次传递中每个人都在等待,因为没有人被允许立即访问资源。
简而言之,将您的初始值设置为零,看看是否能解决问题。
编辑 一点解释:换个角度想,信号量就像一个 n 原子门。你所做的通常是这样的:
// Set the number of tickets:
HANDLE Semaphore = CreateSemaphore(0, 20, 200, 0);
// Later on in a thread somewhere...
// Get a ticket in the queue
WaitForSingleObject(Semaphore, INFINITE);
// Only 20 threads can access this area
// at once. When one thread has entered
// this area the available tickets decrease
// by one. When there are 20 threads here
// all other threads must wait.
// do stuff
ReleaseSemaphore(Semaphore, 1, 0);
// gives back one ticket.
因此,我们将信号量放在这里的用途并不完全是它们设计的用途。
关于c++ - Win32 线程无缘无故地死掉,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4993294/
我正在安装这个程序:THERMUS ,据我所知应该安装正常。我/我通过 ubuntu 控制台安装这个程序。但是当我运行 make all 时,我收到了这条消息: make: ***No rule to
我正在渲染一个简单的 sass 文件并收到以下警告: This selector doesn't have any properties and won't be rendered. ╷ 14
我不明白为什么文本不会与 div 的中间对齐,我认为这是导致页面底部出现空白的原因,我希望文本位于中间(高度)页脚的(两个 div 我都有两个强制文本的每个部分到页面的边缘) HTML:
我正在尝试为 android 创建基本的音乐播放器。对我来说一切似乎都很好,但是当我试图在我的手机上运行应用程序时。它说它停止了。我无法解决那个问题。感谢您的任何帮助。我试图在应用程序停止时查看“Lo
在我的 LoginProvider 中,我使用了一个函数来执行登录并将创建的 session 作为 promise 返回。 @Injectable() export class LoginProvid
我在 Google Cloud Platform 上运行 Dataflow-Jobs,我收到的一个新错误是“Workflow failed”,没有任何解释。我得到的日志如下: 2017-08-25
我已经阅读了无数关于这个错误的主题,但是没有一个和我有同样的问题。 我得到了 E/MediaPlayer: 错误 (-19, 0) E/MediaPlayer: 错误 (-19,0) 错误,然而,音乐
这个错误或我缺乏知识或其他东西真的开始困扰我。我正在开发一个 Grails 应用程序,并且在我的工作过程中随机出现 Grails 提示一些导入,说无法解析类名。它在一个保存前工作!我没有对项目的基础设
我为此失去了头发!我不断收到“发送后无法设置 header ”错误,我确定我没有像在其他问题中看到的那样调用 Next()。我的代码一直在工作,直到我尝试进行一些重构,我没有改变这个类的任何东西,所以
我是一名优秀的程序员,十分优秀!