- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在观察 Python 中的一些极端奇怪的行为。考虑以下代码:
from multiprocessing import Process
import scipy
def test():
pass
for i in range(1000):
p1 = Process(target=test)
p1.start()
p1.join()
print i
当我对此运行 strace -f 时,我从循环中得到以下片段:
clone(Process 19706 attached
child_stack=0, flags=CLONE_CHILD_CLEARTID|CLONE_CHILD_SETTID|SIGCHLD, child_tidptr=0x2b23afde1970) = 19706
[pid 19706] set_robust_list(0x2b23afde1980, 0x18) = 0
[pid 18673] wait4(19706, Process 18673 suspended
<unfinished ...>
[pid 19706] stat("/apps/python/2.7.1/lib/python2.7/multiprocessing/random", 0x7fff041fc150) = -1 ENOENT (No such file or directory)
[pid 19706] open("/apps/python/2.7.1/lib/python2.7/multiprocessing/random.so", O_RDONLY) = -1 ENOENT (No such file or directory)
[pid 19706] open("/apps/python/2.7.1/lib/python2.7/multiprocessing/randommodule.so", O_RDONLY) = -1 ENOENT (No such file or directory)
[pid 19706] open("/apps/python/2.7.1/lib/python2.7/multiprocessing/random.py", O_RDONLY) = -1 ENOENT (No such file or directory)
[pid 19706] open("/apps/python/2.7.1/lib/python2.7/multiprocessing/random.pyc", O_RDONLY) = -1 ENOENT (No such file or directory)
[pid 19706] open("/dev/urandom", O_RDONLY) = 3
[pid 19706] read(3, "\3\204g\362\260\324:]\337F0n\n\377\317\343", 16) = 16
[pid 19706] close(3) = 0
[pid 19706] open("/dev/null", O_RDONLY) = 3
[pid 19706] fstat(3, {st_mode=S_IFCHR|0666, st_rdev=makedev(1, 3), ...}) = 0
[pid 19706] exit_group(0) = ?
Process 18673 resumed
Process 19706 detached
关于在文件系统中搜索“随机”的那些垃圾是怎么回事?我真的想避免这种情况,因为我在集群上并行运行了很多具有这种结构的进程,并且循环速度非常快,而且这种文件系统事件正在阻塞文件系统元数据服务器,或者集群管理员告诉我.
如果我删除“import scipy”命令,那么这个问题就会消失:
clone(Process 23081 attached
child_stack=0, flags=CLONE_CHILD_CLEARTID|CLONE_CHILD_SETTID|SIGCHLD, child_tidptr=0x2b42ec15e970) = 23081
[pid 23081] set_robust_list(0x2b42ec15e980, 0x18) = 0
[pid 22052] wait4(23081, Process 22052 suspended
<unfinished ...>
[pid 23081] open("/dev/null", O_RDONLY) = 3
[pid 23081] fstat(3, {st_mode=S_IFCHR|0666, st_rdev=makedev(1, 3), ...}) = 0
[pid 23081] exit_group(0) = ?
Process 22052 resumed
Process 23081 detached
但我需要在我的真实代码中使用 scipy,所以我无法摆脱它。或者也许我可以,但那会很痛苦。
有谁知道我为什么会看到这种行为?如果它是某些版本的怪癖,我正在运行以下命令:
python :2.7.1,多处理:0.70a1,科学:0.9.0,
实际上,因为我刚刚意识到它可能是系统相关的,所以我在我的笔记本电脑上运行了相同的代码并且没有问题(即输出相当于第二种情况)。在我运行的笔记本电脑上
python :2.6.5,多处理:0.70a1,科学:0.10.0,
也许是早期版本scipy的问题或者bug已经修复了?我对此类内容的搜索一无所获。即使这是问题所在,在集群上更改 scipy 的版本也不是那么容易,尽管如果需要我可能会让集群管理员构建更新的版本。
这可能是问题所在吗?
最佳答案
这不是因为 Windows 或 __main__
模块。这也不是 Python 喜欢做生意的方式。而且,如果您重新检查,我想您会发现这是 Python 2.6 的行为,而不是 2.7 的行为,除非您运行的是经过修改的 2.7。
您是完全正确的,问题源于 multiprocessing.forking
模块中的随机模块初始化步骤——它旨在防止您的进程在 fork 生成 n workers,从创建所有通过完全相同的伪随机数系列前进的 worker(例如,如果他们都使用这些数字协商 SSL 连接,这可能会危及安全性):
if 'random' in sys.modules:
import random
random.seed()
但是这里的关键是要认识到上面的import
语句应该从系统调用的角度来看是一个空操作,因为如果一个模块名已经作为键存在于 sys.modules
字典中,然后 import
简单地返回它在那里找到的值,而不试图从文件系统加载任何东西:
>>> import sys
>>> sys.modules['fake'] = 'Not even a module'
>>> import fake
>>> fake
'Not even a module'
因此,上面引用的 if
语句专门试图防止在 >random
模块甚至还没有被加载。当你在没有加载 scipy
的情况下进行实验时,if
语句体甚至都不会触发。
那么问题是什么?
问题是 Python 2.7 之前的旧版本让你通过在包内的模块中说 import foo
来表示两个不同的东西:你可能是尝试相对导入 the_package.foo
,或者您可能正在尝试导入顶级包 foo
。请参阅 PEP 328 以详细了解为什么在更新的 Python 版本中更改了这种模棱两可且代价高昂的行为:
http://legacy.python.org/dev/peps/pep-0328/
有了这个背景,您可以查看您的 strace
输出,并注意到这里的答案中还没有人提到的东西:stat()
和 open ()
列出的系统调用不是试图导入模块 random
而是名为 multiprocessing.random
的不存在的模块!
这是尝试附加导入的关键原因,即使 random
已经在 sys.modules
中列出——因为在 Python 之前2.6 允许退回到 import
语句真正旨在导入 random
的假设,它必须消除它试图相对导入 的可能性code>multiprocessing.random
因为 import
语句出现在 multiprocessing.forking
子模块的代码中。
程序员真的应该说 sys.modules['random'].seed()
而不是尝试重新导入来避免那些额外的系统调用。但希望一旦您有机会升级到更新版本的 Python,您就不会被这种行为困扰太久。
关于Python 多处理 + scipy : excessive filesystem 'stat' and 'open' attempts,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10973869/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!