- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章深入解析Python中的线程同步方法由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
同步访问共享资源 。
在使用线程的时候,一个很重要的问题是要避免多个线程对同一变量或其它资源的访问冲突。一旦你稍不留神,重叠访问、在多个线程中修改(共享资源)等这些操作会导致各种各样的问题;更严重的是,这些问题一般只会在比较极端(比如高并发、生产服务器、甚至在性能更好的硬件设备上)的情况下才会出现。 比如有这样一个情况:需要追踪对一事件处理的次数 。
1
2
3
4
5
6
|
counter
=
0
def
process_item(item):
global
counter
... do something with item ...
counter
+
=
1
|
如果你在多个线程中同时调用这个函数,你会发现counter的值不是那么准确。在大多数情况下它是对的,但有时它会比实际的少几个。 出现这种情况的原因是,计数增加操作实际上分三步执行
考虑一下这种情况:在当前线程获取到counter值后,另一个线程抢占到了CPU,然后同样也获取到了counter值,并进一步将counter值重新计算并完成回写;之后时间片重新轮到当前线程(这里仅作标识区分,并非实际当前),此时当前线程获取到counter值还是原来的,完成后续两步操作后counter的值实际只加上1。 另一种常见情况是访问不完整或不一致状态。这类情况主要发生在一个线程正在初始化或更新数据时,另一个进程却尝试读取正在更改的数据.
原子操作 实现对共享变量或其它资源的同步访问最简单的方法是依靠解释器的原子操作。原子操作是在一步完成执行的操作,在这一步中其它线程无法获得该共享资源。 通常情况下,这种同步方法只对那些只由单个核心数据类型组成的共享资源有效,譬如,字符串变量、数字、列表或者字典等。下面是几个线程安全的操作:
注意,上面提到过,对一个变量或者属性进行读操作,然后修改它,最终将其回写不是线程安全的。因为另外一个线程会在这个线程读完却没有修改或回写完成之前更改这个共享变量/属性.
锁 。
锁是Python的threading模块提供的最基本的同步机制。在任一时刻,一个锁对象可能被一个线程获取,或者不被任何线程获取。如果一个线程尝试去获取一个已经被另一个线程获取到的锁对象,那么这个想要获取锁对象的线程只能暂时终止执行直到锁对象被另一个线程释放掉。 锁通常被用来实现对共享资源的同步访问。为每一个共享资源创建一个Lock对象,当你需要访问该资源时,调用acquire方法来获取锁对象(如果其它线程已经获得了该锁,则当前线程需等待其被释放),待资源访问完后,再调用release方法释放锁:
1
2
3
4
5
|
lock
=
Lock()
lock.acquire()
#: will block if lock is already held
... access shared resource
lock.release()
|
注意,即使在访问共享资源的过程中出错了也应该释放锁,可以用try-finally来达到这一目的:
1
2
3
4
5
|
lock.acquire()
try
:
... access shared resource
finally
:
lock.release()
#: release lock, no matter what
|
在Python 2.5及以后的版本中,你可以使用with语句。在使用锁的时候,with语句会在进入语句块之前自动的获取到该锁对象,然后在语句块执行完成后自动释放掉锁:
1
2
3
4
|
from
__future__
import
with_statement
#: 2.5 only
with lock:
... access shared resource
|
acquire方法带一个可选的等待标识,它可用于设定当有其它线程占有锁时是否阻塞。如果你将其值设为False,那么acquire方法将不再阻塞,只是如果该锁被占有时它会返回False
1
2
3
4
5
6
7
|
if
not
lock.acquire(
False
):
... 锁资源失败
else
:
try
:
... access shared resource
finally
:
lock.release()
|
你可以使用locked方法来检查一个锁对象是否已被获取,注意不能用该方法来判断调用acquire方法时是否会阻塞,因为在locked方法调用完成到下一条语句(比如acquire)执行之间该锁有可能被其它线程占有.
1
2
3
|
if
not
lock.locked():
#: 其它线程可能在下一条语句执行之前占有了该锁
lock.acquire()
#: 可能会阻塞
|
简单锁的缺点 标准的锁对象并不关心当前是哪个线程占有了该锁;如果该锁已经被占有了,那么任何其它尝试获取该锁的线程都会被阻塞,即使是占有锁的这个线程。考虑一下下面这个例子:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
lock
=
threading.Lock()
def
get_first_part():
lock.acquire()
try
:
... 从共享对象中获取第一部分数据
finally
:
lock.release()
return
data
def
get_second_part():
lock.acquire()
try
:
... 从共享对象中获取第二部分数据
finally
:
lock.release()
return
data
|
示例中,我们有一个共享资源,有两个分别取这个共享资源第一部分和第二部分的函数。两个访问函数都使用了锁来确保在获取数据时没有其它线程修改对应的共享数据。 现在,如果我们想添加第三个函数来获取两个部分的数据,我们将会陷入泥潭。一个简单的方法是依次调用这两个函数,然后返回结合的结果:
1
2
3
4
|
def
get_both_parts():
first
=
get_first_part()
seconde
=
get_second_part()
return
first, second
|
这里的问题是,如有某个线程在两个函数调用之间修改了共享资源,那么我们最终会得到不一致的数据。最明显的解决方法是在这个函数中也使用lock
1
2
3
4
5
6
7
8
|
def
get_both_parts():
lock.acquire()
try
:
first
=
get_first_part()
seconde
=
get_second_part()
finally
:
lock.release()
return
first, second
|
然而,这是不可行的。里面的两个访问函数将会阻塞,因为外层语句已经占有了该锁。为了解决这个问题,你可以通过使用标记在访问函数中让外层语句释放锁,但这样容易失去控制并导致出错。幸运的是,threading模块包含了一个更加实用的锁实现:re-entrant锁。 Re-Entrant Locks (RLock) 。
RLock类是简单锁的另一个版本,它的特点在于,同一个锁对象只有在被其它的线程占有时尝试获取才会发生阻塞;而简单锁在同一个线程中同时只能被占有一次。如果当前线程已经占有了某个RLock锁对象,那么当前线程仍能再次获取到该RLock锁对象.
1
2
3
4
5
6
7
|
lock
=
threading.Lock()
lock.acquire()
lock.acquire()
#: 这里将会阻塞
lock
=
threading.RLock()
lock.acquire()
lock.acquire()
#: 这里不会发生阻塞
|
RLock的主要作用是解决嵌套访问共享资源的问题,就像前面描述的示例。要想解决前面示例中的问题,我们只需要将Lock换为RLock对象,这样嵌套调用也会OK. 。
1
2
3
4
5
6
7
8
9
10
11
12
13
|
lock
=
threading.RLock()
def
get_first_part():
... see above
def
get_second_part():
... see above
def
get_both_parts():
... see above
|
这样既可以单独访问两部分数据也可以一次访问两部分数据而不会被锁阻塞或者获得不一致的数据。 注意RLock会追踪递归层级,因此记得在acquire后进行release操作。 Semaphores 。
信号量是一个更高级的锁机制。信号量内部有一个计数器而不像锁对象内部有锁标识,而且只有当占用信号量的线程数超过信号量时线程才阻塞。这允许了多个线程可以同时访问相同的代码区.
1
2
|
semaphore
=
threading.BoundedSemaphore()
semaphore.acquire()
#: counter减小
|
... 访问共享资源 。
1
|
semaphore.release()
#: counter增大
|
当信号量被获取的时候,计数器减小;当信号量被释放的时候,计数器增大。当获取信号量的时候,如果计数器值为0,则该进程将阻塞。当某一信号量被释放,counter值增加为1时,被阻塞的线程(如果有的话)中会有一个得以继续运行。 信号量通常被用来限制对容量有限的资源的访问,比如一个网络连接或者数据库服务器。在这类场景中,只需要将计数器初始化为最大值,信号量的实现将为你完成剩下的事情.
1
2
3
|
max_connections
=
10
semaphore
=
threading.BoundedSemaphore(max_connections)
|
。
如果你不传任何初始化参数,计数器的值会被初始化为1. Python的threading模块提供了两种信号量实现。Semaphore类提供了一个无限大小的信号量,你可以调用release任意次来增大计数器的值。为了避免错误出现,最好使用BoundedSemaphore类,这样当你调用release的次数大于acquire次数时程序会出错提醒。 线程同步 。
锁可以用在线程间的同步上。threading模块包含了一些用于线程间同步的类。 Events 。
一个事件是一个简单的同步对象,事件表示为一个内部标识(internal flag),线程等待这个标识被其它线程设定,或者自己设定、清除这个标识.
1
2
3
4
5
6
7
8
|
event
=
threading.Event()
#: 一个客户端线程等待flag被设定
event.wait()
#: 服务端线程设置或者清除flag
event.
set
()
event.clear()
|
一旦标识被设定,wait方法就不做任何处理(不会阻塞),当标识被清除时,wait将被阻塞直至其被重新设定。任意数量的线程可能会等待同一个事件。 Conditions 。
条件是事件对象的高级版本。条件表现为程序中的某种状态改变,线程可以等待给定条件或者条件发生的信号。 下面是一个简单的生产者/消费者实例。首先你需要创建一个条件对象:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
#: 表示一个资源的附属项
condition
=
threading.Condition()
生产者线程在通知消费者线程有新生成资源之前需要获得条件:
#: 生产者线程
... 生产资源项
condition.acquire()
... 将资源项添加到资源中
condition.notify()
#: 发出有可用资源的信号
condition.release()
消费者必须获取条件(以及相关联的锁),然后尝试从资源中获取资源项:
#: 消费者线程
condition.acquire()
while
True
:
...从资源中获取资源项
if
item:
break
condition.wait()
#: 休眠,直至有新的资源
condition.release()
... 处理资源
|
wait方法释放了锁,然后将当前线程阻塞,直到有其它线程调用了同一条件对象的notify或者notifyAll方法,然后又重新拿到锁。如果同时有多个线程在等待,那么notify方法只会唤醒其中的一个线程,而notifyAll则会唤醒全部线程。 为了避免在wait方法处阻塞,你可以传入一个超时参数,一个以秒为单位的浮点数。如果设置了超时参数,wait将会在指定时间返回,即使notify没被调用。一旦使用了超时,你必须检查资源来确定发生了什么。 注意,条件对象关联着一个锁,你必须在访问条件之前获取这个锁;同样的,你必须在完成对条件的访问时释放这个锁。在生产代码中,你应该使用try-finally或者with. 可以通过将锁对象作为条件构造函数的参数来让条件关联一个已经存在的锁,这可以实现多个条件公用一个资源:
1
2
3
|
lock
=
threading.RLock()
condition_1
=
threading.Condition(lock)
condition_2
=
threading.Condition(lock)
|
互斥锁同步 我们先来看一个例子:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import
time, threading
# 假定这是你的银行存款:
balance
=
0
muxlock
=
threading.Lock()
def
change_it(n):
# 先存后取,结果应该为0:
global
balance
balance
=
balance
+
n
balance
=
balance
-
n
def
run_thread(n):
# 循环次数一旦多起来,最后的数字就变成非0
for
i
in
range
(
100000
):
change_it(n)
t1
=
threading.Thread(target
=
run_thread, args
=
(
5
,))
t2
=
threading.Thread(target
=
run_thread, args
=
(
8
,))
t3
=
threading.Thread(target
=
run_thread, args
=
(
9
,))
t1.start()
t2.start()
t3.start()
t1.join()
t2.join()
t3.join()
print
balance
|
结果
1
2
3
4
5
6
7
8
|
[
/data/web/test_python
]$ python multhread_threading.py
0
[
/data/web/test_python
]$ python multhread_threading.py
61
[
/data/web/test_python
]$ python multhread_threading.py
0
[
/data/web/test_python
]$ python multhread_threading.py
24
|
上面的例子引出了多线程编程的最常见问题:数据共享。当多个线程都修改某一个共享数据的时候,需要进行同步控制。 线程同步能够保证多个线程安全访问竞争资源,最简单的同步机制是引入互斥锁。互斥锁为资源引入一个状态:锁定/非锁定。某个线程要更改共享数据时,先将其锁定,此时资源的状态为“锁定”,其他线程不能更改;直到该线程释放资源,将资源的状态变成“非锁定”,其他的线程才能再次锁定该资源。互斥锁保证了每次只有一个线程进行写入操作,从而保证了多线程情况下数据的正确性.
threading模块中定义了Lock类,可以方便的处理锁定:
1
2
3
|
#创建锁mutex = threading.Lock()
#锁定mutex.acquire([timeout])
#释放mutex.release()
|
其中,锁定方法acquire可以有一个超时时间的可选参数timeout。如果设定了timeout,则在超时后通过返回值可以判断是否得到了锁,从而可以进行一些其他的处理。 使用互斥锁实现上面的例子的代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
balance
=
0
muxlock
=
threading.Lock()
def
change_it(n):
# 获取锁,确保只有一个线程操作这个数
muxlock.acquire()
global
balance
balance
=
balance
+
n
balance
=
balance
-
n
# 释放锁,给其他被阻塞的线程继续操作
muxlock.release()
def
run_thread(n):
for
i
in
range
(
10000
):
change_it(n)
|
加锁后的结果,就能确保数据正确:
1
2
3
4
5
6
7
8
|
[
/data/web/test_python
]$ python multhread_threading.py
0
[
/data/web/test_python
]$ python multhread_threading.py
0
[
/data/web/test_python
]$ python multhread_threading.py
0
[
/data/web/test_python
]$ python multhread_threading.py
0
|
。
最后此篇关于深入解析Python中的线程同步方法的文章就讲到这里了,如果你想了解更多关于深入解析Python中的线程同步方法的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
最近做一个项目,由于是在别人框架里开发app,导致了很多限制,其中一个就是不能直接引用webservice 。 我们都知道,调用webserivice 最简单的方法就是在 "引用"
这是SDL2代码的一部分 SDL主函数 int main(int argc,char *argv[]) { ... ... bool quit=false; S
c 中的函数: PHPAPI char *php_pcre_replace(char *regex, int regex_len, ch
我有以下映射: public class SecurityMap : ClassMap { public SecurityMap() {
我在vue-lic3中使用了SCSS,但是有一个奇怪的错误,使用/ deep /会报告错误,我不想看到它。 代码运行环境 vue-cli3 + vant + scss 的CSS /deep/ .van
我在深入阅读 C# 时遇到了这个我能理解的内容: 当它被限制为引用类型时,执行的比较类型完全取决于类型参数被限制为什么。 但是不能理解这个: 如果进一步限制派生自重载 == 和 != 运算符的特定类型
Closed. This question is opinion-based。它当前不接受答案。 想改善这个问题吗?更新问题,以便editing this post用事实和引用来回答。 3年前关闭。
有人可以详细介绍关于自赋值的运算符重载中的 *this 和 const 例如: Class& Class::operator=(const Class& other) { a = other.
在向树中插入新节点时,如何填充闭包表的深度/长度列? ancestor 和 descendant 中的值是来自另一个表的 ID,表示要以树结构排列的页面。 关闭表: ancestor desce
现在我正在阅读“深入了解 C#”。缺少的一件事是完成一章后我可以解决的一系列问题。那会帮助我理解我刚刚学到的概念。 哪里可以找到适合 C#3.0 的问题集? 谢谢 最佳答案 你可以试试LINQ 101
TypeScript 给 JavaScript 扩展了类型的语法,我们可以给变量加上类型,在编译期间会做类型检查,配合编辑器还能做更准确的智能提示。此外,TypeScript 还支持了高级类型用
是否有一个单行代码来获取生成器并生成该生成器中的所有元素?例如: def Yearly(year): yield YEARLY_HEADER for month in range(1, 13)
所以我阅读了一些与“什么是方法组”相关的 StackOverflow 问题以及其他互联网文章,它们在底线都说了同样的话——方法组是“一组重载方法” ". 但是,在阅读 Jon Skeet 的“C# 深
有什么方法可以从子组件中获取子组件吗? 想象一下以下组件树: 应用程序 问题 问题选项(包含复选框) 问题选项(包含复选框) 问题选项(包含复选框) 我想从 App 访问问题选项以选中所有复选框。 参
class_eval 和 instance_eval 在定义方法等情况下是完全可以预测的。我也理解类的实例和类的单例(又名特征类)之间的区别。 但是 我无法弄清楚以下唯一的事情:比方说,出于某些策略目
我想出了如何将符号 rwx 部分读取/转换为 421 个八进制部分,这非常简单。但是当涉及到特殊字符时,我感到非常困惑。我们知道 -r-xr---wx 转换为 0543,但 -r-sr---wt 或
我怀疑我系统的 Java 版本有问题。某些应用程序出现段错误或内存不足或存在链接错误。如果我从源代码安装了 JDK,我会做类似“make test”的事情,看看哪些测试失败了。但是,看起来从源代码构建
如何克隆一个 repo(使用 libgit2 ) 我想做什么git clone确实,但有 libgit2 .我可能要问的是什么 git clone确实很深入。 这是我目前正在做的: 初始化一个repo
00、头痛的JS闭包、词法作用域? 被JavaScript的闭包、上下文、嵌套函数、this搞得很头痛,这语言设计的,感觉比较混乱,先勉强理解总结一下😂😂😂.
我开始玩 lubridate R 中的包。我注意到 now(tzone="EST")计算为: [1] "2015-08-25 13:01:08 EST" 而 now(tzone="PST")导致警告:
我是一名优秀的程序员,十分优秀!