parallel-processing - ipython 笔记本 : how to parallelize external script-6ren

parallel-processing - ipython 笔记本 : how to parallelize external script

转载作者：行者123 更新时间：2023-12-05 00:25:26

30

4

我正在尝试使用 ipython 并行库中的并行计算。但是我对此知之甚少，而且我发现很难从对并行计算一无所知的人那里阅读该文档。

有趣的是，我发现的所有教程都只是重复使用文档中的示例，并使用相同的解释，从我的角度来看，这是无用的。

基本上我想做的是在后台运行几个脚本，以便它们同时执行。在 bash 中它会是这样的:

for my_file in $(cat list_file); do
    python pgm.py my_file &
done

但是 Ipython notebook 的 bash 解释器不处理后台模式。

似乎解决方案是使用 ipython 的并行库。

我试过 :

from IPython.parallel import Client
rc = Client()
rc.block = True
dview = rc[:2] # I take only 2 engines

但后来我被困住了。我不知道如何同时运行两次(或更多)相同的脚本或 pgm。

谢谢。

最佳答案

一年后，我终于得到了我想要的东西。

1) 使用您想要在不同 cpu 上执行的操作创建一个函数。这里它只是使用 ! 从 bash 调用脚本。魔术 ipython 命令。我想它可以与 call() 一起使用功能。

def my_func(my_file):
    !python pgm.py {my_file}

不要忘记 {}使用 ! 时

还要注意 my_file 的路径应该是绝对的，因为集群是您启动笔记本的位置(在执行 jupyter notebook 或 ipython notebook 时)，不一定是您所在的位置。

2) 使用您想要的 CPU 数量启动您的 ipython notebook 集群。
等待 2s 并执行以下单元格:

from IPython import parallel
rc = parallel.Client()
view = rc.load_balanced_view()

3) 获取要处理的文件列表:

files = list_of_files

4) 将您的函数与所有文件异步映射到 view您刚刚创建的引擎。 (不确定措辞)。

r = view.map_async(my_func, files)

当它运行时，您可以在笔记本上做其他事情(它在“ 背景中运行!)。您也可以调用 r.wait_interactive()它以交互方式枚举已处理的文件数、到目前为止花费的时间以及剩余的文件数。这将阻止您运行其他单元格(但您可以中断它)。

如果你的文件比引擎多，不用担心，一旦引擎完成 1 个文件，它们就会被处理。

希望这对其他人有帮助!

本教程可能会有所帮助:

http://nbviewer.ipython.org/github/minrk/IPython-parallel-tutorial/blob/master/Index.ipynb

另请注意，我还有 IPython 2.3.1 ，不知道自从 Jupyter之后有没有变化.

编辑:仍然适用于 Jupyter，请参阅 here for difference and potential issues you may encounter

请注意，如果您在函数中使用外部库，则需要在不同的引擎上导入它们:

%px import numpy as np

或者

%%px
import numpy as np
import pandas as pd

与变量和其他函数相同，您需要将它们推送到引擎 namespace :

rc[:].push(dict(
                foo=foo,
                bar=bar))

关于parallel-processing - ipython 笔记本 : how to parallelize external script，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24312284/

30

4

0

文章推荐： arrays - 将 3d 数组中的工作表行绑定(bind)为 2d 数组

文章推荐： msbuild - 如何在 Tfs Build 中参数化 DeployIisAppPath Msbuild 参数

ipython - 我可以在不离开 ipython 的情况下停止在 ipython 中执行当前模块吗
我想跳出当前正在运行的程序并返回到 shell(无需重新启动 ipython) 最佳答案在 Windows 上重新安装 console2 和 ipython 后，我遇到了同样的问题。如果您使用 ip
ipython - 将 IPython 控制台与 IPython 笔记本一起使用
在使用 IPython 笔记本时，我越来越希望笔记本上附有一个控制台，以进行交互式编程。我发现自己添加了几行来测试代码片段，然后删除它们，这就是很好的用法。在更糟糕的用法中，我会更改同一行中的命令，一
ipython - IPython 魔法是如何工作的
ipthon-sql 是 ipython 的扩展，我先通过 pip install ipython-sql 安装项目在这里:https://github.com/catherinedevlin/ip
ipython - IPython Notebook中的while循环的优美中断
我正在ipython Notebook中运行一些数据分析。一台单独的计算机收集一些数据并将其保存到服务器文件夹中，我的笔记本电脑会定期在该服务器上扫描新文件并进行分析。我在while循环中执行此操作
ipython - ipython Notebook在不同端口上的多个实例
我想让多个ipython Notebook实例在同一用户的不同端口上运行。可能吗？类似于“NotebookApp.port”的端口列表(带有默认端口)。最佳答案再次运行jupyter noteb
ipython - `get_ipython' 在 IPython/IPython Notebook 的启动脚本中不起作用...？
所以 - ROOT 社区中的好人创造了以下魔法: # This is for intercepting the output of ROOT # In a cell, put %%rootprint
ipython - IPython 笔记本的外部编辑器
我正在使用 IPython 笔记本，我想在外部编辑器中编辑程序。我如何获得 %edit file_name.py打开 Notepad++ 等编辑器。最佳答案运行 %edit?将为您提供%edit
ipython - ipython 笔记本中几何代数的良好输出
精简版我能否在 ipython 笔记本中获得 sympy 几何代数对象的漂亮 latex 风格打印？更长的版本在ipython笔记本，我可以从 sympy 得到各种数学对象的 pretty-pr
ipython - ipython 变量扩展如何工作？
我不明白第四个和第六个提示中的 ${} 正在做什么，并且我找不到任何关于此的文档，Python for Unix and Linux 一书系统管理员有一个类似于第六个提示中的示例，其中变量不仅前面加上
ipython - 启动 IPython
我想在已安装 Python 2.7 的 Windows XP 计算机上运行 IPython(版本 0.12)。我通过 Windows 二进制安装程序安装，但安装后 IPython 没有显示在菜单中，
ipython - ipython 中的括号匹配
IPython 中是否有自动关闭方括号、引号、圆括号等的选项？我希望有一个类似于 gedit 插件中的功能。最佳答案通过调整 ~/.inputrc 可以让应用程序(包括 IPython)使用 r
ipython - IPython 提示号有什么用？
我正在使用 IPython Web 笔记本，每个 block 之前都有一个提示编号，例如“In [68]:”。这个提示号码的用途是什么？你能用它做任何事吗？您可以/应该重置它吗？最佳答案 IPyth
ipython - iPython Notebook 中的默认笔记本目录 - iPython 3.0.0
我升级到 iPython 3.0.0(Python 3.4；使用 Anaconda 环境；Mac OSX 10.9.5)，打开新的 iPython Notebook session 的行为似乎发生了变
ipython - 打开 'ipython notebook' 为 : IPython notebook vs Jupyter
我希望能找到更多关于以下内容的文档: From one computer: C:\Python>ipython notebook opens the browser as 'IPython Noteb
ipython - 无法在 IPython 笔记本中上传大文件
我正在尝试在我的 IPython 笔记本中上传一个大小为 500MB 的网络日志文件。但是我收到错误消息“无法上传文件 >25Mb”。有什么方法可以克服这个错误。任何帮助将不胜感激。谢谢。最佳答
ipython - %precision 不尊重 IPython
简单地说，魔术函数 %precision 不考虑简单变量输出的浮点精度。 #Configure matplotlib to run on the browser %matplotlib noteboo
ipython - 设置 iPython 默认配置文件
安装 IPython 后，我立即创建了一个默认配置文件: $ ipython profile create 然后，我创建了另一个，这次我给它起了名字testing: $ ipython profile
ipython - jupyter/ipython 中的拆分单元格不起作用
我已经尝试使用命令来拆分单元格“m -”，但它不起作用。使用 esc 或 fn 键作为修饰符时，所有键命令的重置都可以正常工作。我也处于正确的模式(edititng 模式)。最佳答案在编辑模式下，
ipython - 更改 ipython 笔记本字体类型
我想将 ipython 笔记本中的字体类型更改为 consolas 字体类型。我首先使用 ipython profile create 但是，我不清楚在此配置文件中指定字体类型的语法。任何帮助表示赞
ipython - 我可以将 ipython 命令行历史保存到笔记本文件中吗？
我正在使用 iPython 命令行界面，经过一些操作后，我想将操作历史记录保存到笔记本文件中。但我从一开始就没有使用 iPython notebook。我还能做到吗？最佳答案来自@Thomas K

首页

博学

6Ren·AI

商城

parallel-processing - ipython 笔记本 : how to parallelize external script