解决pytorch trainloader遇到的多进程问题-6ren

解决pytorch trainloader遇到的多进程问题

转载作者：qq735679552 更新时间：2022-09-27 22:32:09

66

4

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章解决pytorch trainloader遇到的多进程问题由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

pytorch中尝试用多进程加载训练数据集，源码如下:

 
    ? 
   
         trainloader  
         = 
         torch.utils.data.DataLoader(trainset, batch_size 
         = 
         4 
         , shuffle 
         = 
         True 
         , num_workers 
         = 
         3 
         )

结果报错:

RuntimeError: An attempt has been made to start a new process before the current process has finished its bootstrapping phase. 。

This probably means that you are not using fork to start your child processes and you have forgotten to use the proper idiom in the main module

if __name__ == '__main__': freeze_support() ... 。

The "freeze_support()" line can be omitted if the program is not going to be frozen to produce an executable. 。

从报错信息可以看到，当前进程在运行可执行代码时，产生了一个新进程。这可能意味着您没有使用fork来启动子进程或者是未在主模块中正确使用.

后来经过查阅发现了原因，因为windows系统下默认用spawn方法部署多线程，如果代码没有受到__main__模块的保护，新进程都认为是要再次运行的代码，将尝试再次执行与父进程相同的代码，生成另一个进程，依此类推，直到程序崩溃.

解决方法很简单

把调用多进程的代码放到__main__模块下即可.

 
    ? 
   
 
     
       
       
         if 
         __name__  
         = 
         = 
         '__main__' 
         : 
        
 
              
         transform  
         = 
         transforms.Compose([transforms.ToTensor(), transforms.Normalize(( 
         0.5 
         ,  
         0.5 
         ,  
         0.5 
         ), ( 
         0.5 
         ,  
         0.5 
         ,  
         0.5 
         ))]) 
        
 
              
         trainset  
         = 
         torchvision.datasets.CIFAR10(root 
         = 
         './data' 
         , train 
         = 
         True 
         , download 
         = 
         True 
         , transform 
         = 
         transform) 
        
 
              
         trainloader  
         = 
         torch.utils.data.DataLoader(trainset, batch_size 
         = 
         4 
         , shuffle 
         = 
         True 
         , num_workers 
         = 
         3 
         ) 
        
 
     
 
   

补充：pytorch-Dataloader多进程使用出错。

使用Dataloader进行多进程数据导入训练时，会因为多进程的问题而出错。

dataloader = DataLoader(transformed_dataset, batch_size=4,shuffle=True, num_workers=4) 。

其中参数num_works=表示载入数据时使用的进程数，此时如果参数的值不为0而使用多进程时会出现报错。

RuntimeError: An attempt has been made to start a new process before the current process has finished its bootstrapping phase. This probably means that you are not using fork to start your child processes and you have forgotten to use the proper idiom in the main module: if __name__ == '__main__': freeze_support() ... The "freeze_support()" line can be omitted if the program is not going to be frozen to produce an executable. 。

此时在数据的调用之前加上if __name__ == '__main__':即可解决问题。

 
    ? 
   
         if 
         __name__  
         = 
         = 
         '__main__' 
         : 
         #这个地方可以解决多线程的问题 
        
         for 
         i_batch, sample_batched  
         in 
         enumerate 
         (dataloader):

以上为个人经验，希望能给大家一个参考，也希望大家多多支持我.

原文链接：https://blog.csdn.net/zhang123454lulu/article/details/83374860 。

最后此篇关于解决pytorch trainloader遇到的多进程问题的文章就讲到这里了,如果你想了解更多关于解决pytorch trainloader遇到的多进程问题的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

66

4

0

文章推荐： OpenGL实现边缘填充算法

文章推荐：详解ElasticSearch6.4.0集群搭建

文章推荐： OpenGL扫描线填充算法详解

文章推荐： Pytorch测试神经网络时出现 RuntimeError:的解决方案

linux - 如何通过 STIME 终止 linux 进程(悬空 svnserve 进程)
我是 Linux 的新手，并且继承了保持我们的单一 Linux 服务器运行的职责。这是我们的SVN服务器，所以比较重要。原来在我之前维护它的人有一个 cron 任务，当有太多 svnserve 进程
Nodejs极简入门教程（三）：进程
Node 虽然自身存在多个线程，但是运行在 v8 上的 JavaScript 是单线程的。Node 的 child_process 模块用于创建子进程，我们可以通过子进程充分利用 CPU。范例：
ubuntu - Jenkins 进程
Jenkins 有这么多进程处于事件状态是否正常？我检查了我的设置，我只配置了 2 个“执行者”... htop http://d.pr/i/RZzG+ 最佳答案您不仅要限制 Master 中的执
带管道的 Scala 进程
我正在尝试在 scala 中运行这样的 bash 命令: cat "example file.txt" | grep abc Scala 有一个特殊的流程管道语法，所以这是我的第一个方法: val f
循环和文件输出中的 Java 进程
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
multithreading - 进程、线程和并发编程
我需要一些帮助来理解并发编程的基础知识。事实上，我读得越多，就越感到困惑。因此，我理解进程是顺序执行的程序的一个实例，并且它可以由一个或多个线程组成。在单核CPU中，一次只能执行一个线程，而在多核CP
testing - 在集成测试期间如何运行服务器(进程)？
我的问题是在上一次集成测试后服务器进程没有关闭。在integration.rs中，我有: lazy_static! { static ref SERVER: Arc> = {
Scala 进程 - 捕获标准输出和退出代码
我正在使用 Scala scala.sys.process图书馆。我知道我可以用 ! 捕获退出代码和输出 !!但是如果我想同时捕获两者呢？我看过这个答案 https://stackoverflow
c++ - 使用共享库同步两个C++进程
我正在开发一个C++类(MyClass.cpp)，将其编译为动态共享库(MyClass.so)。同一台Linux计算机上运行的两个不同应用程序将使用此共享库。它们是两个不同的应用程序。它不是多线程
c - 查找UDP数据包的源IP/进程
我在我的 C 程序中使用 recvfrom() 从多个客户端接收 UDP 数据包，这些客户端可以使用自定义用户名登录。一旦他们登录，我希望他们的用户名与唯一的客户端进程配对，这样服务器就可以通过数据包
C、进程、fork
如何更改程序，以便函数 function_delayed_1 和 function_delayed_2 仅同时执行一次: int main(int argc, char *argv[]) {
c - 操作系统 - 进程
考虑这两个程序: //in #define MAX 50 int main(int argc, char* argv[]) { int *count; int fd=shm
linux - 如何同时打开三个终端(进程)
请告诉我如何一次打开三个终端，这样我的项目就可以轻松执行，而不必打开三个终端三次然后运行三个exe文件。请问我们如何通过脚本来做到这一点，即打开三个终端并执行三个 exe 文件。最佳答案在后台运行
远程计算机上的 C# 进程
我编写了一个监控服务来跟踪一组进程，并在服务行为异常、内存使用率高、超出 CPU 运行时间等时发出通知。这在我的本地计算机上运行良好，但我需要它指向远程机器并获取这些机器上的进程信息。我的方法，在
c# - 进程、线程和线程池
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 8年前关闭。 Improve this qu
c# - 后台线程/进程
我有一个允许用户上传文件的应用程序。上传完成后，必须在服务器上完成许多处理步骤(解压、存储、验证等...)，因此稍后会在一切完成后通过电子邮件通知用户。我见过很多示例，其中 System.Compo
linux - 什么时候将虚拟地址分配给程序/进程？
这个问题对很多人来说可能听起来很愚蠢，但我想对这个话题有一个清晰的理解。例如:当我们在 linux(ubuntu, x86) 上构建一个 C 程序时，它会在成功编译和链接过程后生成 a.out。 a.
java - 在linux中如何识别一个进程是java还是c或c++进程？
ps -eaf | grep java 命令在这里不是识别进程是否是 java 进程的解决方案，因为执行此命令后我的许多 java 进程未在输出中列出。最佳答案简答(希望有人写一个更全面的): 获
内核与系统中的 Windows 进程
我有几个与内核态和用户态的 Windows 进程相关的问题。如果我有一个 hello world 应用程序和一个暴露新系统调用 foo() 的 hello world 驱动程序，我很好奇在内核模式下
具有不受信任完整性级别的 Windows 进程
我找不到很多关于 Windows 中不受信任的完整性级别的信息，对此有一些疑问: 是否有不受信任的完整性级别进程可以创建命名对象的地方？ (互斥锁、事件等) 不受信任的完整性级别进程是否应该能够打开一

首页

博学

6Ren·AI

商城

解决pytorch trainloader遇到的多进程问题

解决方法很简单