作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个较大的对象(150 MB),我需要将它广播给所有 dask 分布式工作人员,以便它可以在 future 的任务中使用。我尝试了几种方法:
Client.scatter(broadcast=True)
:这需要从一台机器(我在其中运行客户端和调度程序)发送所有数据,这会造成带宽瓶颈。 Client.submit
其次是 Client.replicate
:这些工作人员共享一个文件系统,因此我可以安排加载数据的任务,然后将数据复制到所有工作人员,而不是发送数据。这似乎使用树策略来分发数据,这比之前的选项更快。 Client.run
似乎是我想要的一部分,但我需要为加载的数据取回一个 future ,我可以稍后将其传递给其他任务。
最佳答案
这里的简短回答是“不”,没有直接的方法可以做到这一点。如果您习惯使用内部代码(可能会在没有警告的情况下更改),则可以将某些东西一起破解。
另一种方法是定义对象如何序列化的计算行为,然后在反序列化代码中再次调用该函数。
关于dask - 当计算速度比分布式 dask 中的传输速度快时,如何复制数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51027287/
不知道这是不是一个正确的问题,但出于好奇,我想知道哪个会被快速搜索。例如- John 或 我已经存储了数百万个文本作为属性值,尽管字符大小不够大。以上只是为了更好地理解这个问题的一个
我有一张表,里面有大约 500,000 个用户。当我使用我的 Rails 3.0 控制台并输入 User.first 我立即得到结果。但是当我输入 User.first(1) 需要几秒钟。可能是什么原
我是一名优秀的程序员,十分优秀!