- VisualStudio2022插件的安装及使用-编程手把手系列文章
- pprof-在现网场景怎么用
- C#实现的下拉多选框,下拉多选树,多级节点
- 【学习笔记】基础数据结构:猫树
参考:https://zhuanlan.zhihu.com/p/613630658 。
在Linux上,有pthread的使用,而C++ 11标准中使用了<thread>,是一个良好的跨平台方案。 thread和pthread在实际的使用中有一些显著的差别,典型例子如: pthread_create用来创建线程,而std::thread可以直接被用来创建线程.
客观来说,thread是一个更为简洁的实现,而pthread难免有些粗暴,本文在C++的多线程编程中主要以thread风格来实现.
子线程退出与主线程退出的关系 引用:
所以,重新理解detach:把主进程和子线程分离,使二者能够独立的运行.
备注:此节部分内容及代码来源于帝国理工学院COMP60017 - L05 - Multi-core and Parallelism, Lluís Vilanova 。
由于现代CPU使用乱序流水线(out-of-order)的方式进行指令的执行,因此对于某一条单独的a = b + 1指令来说,其在O2优化层级上可以被分解为以下三条汇编指令:
mov eax, DWORD PTR [rbp-8]
add eax, 1
mov DWORD PTR [rbp-4], eax
模拟编译(以及编译优化):https://godbolt.org/ 。
由此可见,在没有进行任何额外处理的情况下,有可能在add与mov操作之间出现进程的切换调度,因此就会出现伪递增现象,即为两个并行线程同时对一个变量自增10000次,最后结果通常要小于20000.
atomic是C++中的一个关键字,作用是针对某一个具体变量,提供一组'原子的'操作.
在本质上是对单条指令的临界区保护.
具体使用例子如下:
// Use atomic operations on data shared across threads
#include <atomic>
#include <thread>
#include <iostream>
int main(int argc, char** argv) {
int iters = 100000000; std::atomic<int> a = 0;
std::thread t1([&](){ for (volatile int i = 0; i < iters; i++) a++; });
std::thread t2([&](){ for (volatile int i = 0; i < iters; i++) a++; });
t1.join(); t2.join();
std::cout << "expected=" << iters*2 << " got=" << a << std::endl;
}
在C++中,有两种atomic的使用方式:
std::atomic<int> a = 0;
atomic_fetch_add(&a, 1);
参考:https://en.cppreference.com/w/cpp/atomic/atomic/compare_exchange 。
int beings, legs;
void enter_room(int nlegs) {
atomic_fetch_add(&beings, 1);
atomic_fetch_add(&legs, nlegs);
}
参见:https://en.cppreference.com/w/cpp/atomic/atomic 。
std::memory_order_seq_cst 。
这个面试底层经常问,最好搞明白 。
无锁相比于加锁操作来说,最大的优势是性能显著提高.
大多数现代CPU在硬件层面上都提供了原子实现CAS的机制.
shared lock: 读写锁,多个thread可以同时读,但只有一个能写 。
在Linux中的pthread库中,我们采用了CAS作为读写锁的实现方式 。
CAS操作,全名为Compare-and-swap(比较并交换)操作,是一个原子的操作.
在C++中,一个简单的实现:
bool compare_and_swap(int *pAddr, int nExpected, int nNew)
{
if(*pAddr == nExpected)
{
*pAddr = nNew;
return true;
}
else
return false;
}
这里提供一个使用CAS进行自增的操作:
void atomic_inc(uint64_t* addr) {
bool swapped = false;
while (not swapped) {
auto old = *addr;
swapped = CAS(addr, old, old+1);
}
}
线程临界区:对于只读不写的变量,不需要保护 。
▪ Lock/mutex ▪ Semaphore ▪ Shared lock (aka, read/write lock) ▪ Condition variables ▪ Barrier 。
例:使用条件变量condition_variable 。
例题:leetcode 1117. H2O 生成 。
在C++中,condition_variable必须结合unique_lock使用,此外还有一个condition_variable_any类可以使用所有的锁,此处暂时不论.
基本使用流程:mutex lock -> wait -> mutex unlock 。
wait函数阻塞完成后即自动unlock释放锁,不需要手动释放.
虚假唤醒:使用notify_all()函数唤醒所有wait状态下的线程时,发现其等待的条件并没有满足.
解决方法:
while (g_deque.empty())
{
g_cond.wait(lck);
}
cv.wait(lck,[this]{return printo > 0;});//此处用了lambda函数,在类中所以需要this,较为方便
异步编程:回调函数callback 。
c++11:中新增了std::future 和 std::promise 。
c++20:提供了co_routine(协程),在适当的时候做挂起(suspend)和恢复(resume),是个基于state machine的无栈协程 。
评价为对golang的拙劣模仿(原生支持,从来没见人在C++中用过) 。
我在这个项目中从内核到userspace维护了一个支持热迁移的虚拟机状态流,就用了类似的思想,但是这里是个有栈协程:https://github.com/mahiru23/intravisor/tree/syscall/src 。
这篇文章讲了协程,感觉不错:https://www.cnblogs.com/lizhaolong/p/16437246.html 。
缺点:
这里给出一个仅使用 。
#include <iostream>
#include <atomic>
#include <thread>
#include <cstdlib>
#include <ctime>
#include <unistd.h>
class mysem {
public:
mysem(uint32_t init_value);
void acquire();
void release();
private:
std::atomic<uint32_t> counter;
};
mysem::mysem(uint32_t init_value) {
counter.store(init_value, std::memory_order_seq_cst);
}
void mysem::acquire() {
if(counter.load(std::memory_order_seq_cst) > 0) {
counter.fetch_sub(1);
}
else {
while (counter.load(std::memory_order_seq_cst) <= 0) {
// busy-wait
}
}
}
void mysem::release() {
counter.fetch_add(1);
}
void random_work() {
usleep((rand()%1000)*10);
}
int main(int argc, char**argv)
{
srand(time(nullptr));
mysem s(1);
std::thread t1([&](){
random_work();
s.acquire();
std::cout << 1; random_work(); std::cout << 1;
s.release();
});
std::thread t2([&](){
random_work();
s.acquire();
std::cout << 2; random_work(); std::cout << 2;
s.release();
});
t1.join(); t2.join();
std::cout << std::endl;
}
阻塞后sleep,内核层面awake 按照顺序,保证了阻塞线程的公平性 然而,这种方法更加expensive,因为过程中需要syscall 。
在Linux的pthread_mutex_lock内部使用了Linux futex.
在较短的时间内使用user-level,对于等待时间较长的thread由kernel syscall处理(先busy-wait,再阻塞) 。
glibc的pthread实现方式:提前预测可能需要花费多长时间:Can adapt user-level busy-wait time dynamically 。
给出一段CAS + futex的混合代码:
#include <iostream>
#include <atomic>
#include <thread>
#include <cstdlib>
#include <ctime>
#include <unistd.h>
#include <sys/syscall.h>
#include <linux/futex.h>
#include <sys/time.h>
class mysem {
public:
mysem(uint32_t init_value);
void acquire();
void release();
private:
std::atomic<uint32_t> counter;
};
mysem::mysem(uint32_t init_value) {
counter.store(init_value, std::memory_order_seq_cst);
}
void mysem::acquire() {
for (int i = 0; i < 100; ++i) {
uint32_t expected = counter.load(std::memory_order_seq_cst);
if (expected > 0 && counter.compare_exchange_strong(expected, expected - 1, std::memory_order_seq_cst)) {
return;
}
}
uint32_t* counter_ptr = reinterpret_cast<uint32_t*>(&counter);
syscall(SYS_futex, counter_ptr, FUTEX_WAIT, counter.load(std::memory_order_seq_cst) > 0, nullptr, nullptr, 0);
}
void mysem::release() {
counter.fetch_add(1);
uint32_t* counter_ptr = reinterpret_cast<uint32_t*>(&counter);
syscall(SYS_futex, counter_ptr, FUTEX_WAKE, 1, nullptr, nullptr, 0);
}
void random_work() {
usleep((rand()%1000)*10);
}
int main(int argc, char**argv)
{
srand(time(nullptr));
mysem s(1);
std::thread t1([&](){
random_work();
s.acquire();
std::cout << 1; random_work(); std::cout << 1;
s.release();
});
std::thread t2([&](){
random_work();
s.acquire();
std::cout << 2; random_work(); std::cout << 2;
s.release();
});
t1.join(); t2.join();
std::cout << std::endl;
}
thread_local 引用:https://zhuanlan.zhihu.com/p/77585472 。
C++ 11 引入了thread_local,作为线程内部的私有本地变量 应用场景:多线程无锁编程 。
最后此篇关于C++中的多线程及其之后的周边的文章就讲到这里了,如果你想了解更多关于C++中的多线程及其之后的周边的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我是一名优秀的程序员,十分优秀!