gpt4 book ai didi

scala - 为什么 word2vec 只在 Word2Vec.scala :323 处为 mapPartitionsWithIndex 执行一项任务

转载 作者:行者123 更新时间:2023-12-04 15:30:37 25 4
gpt4 key购买 nike

我在 spark 中运行 word2vec,当涉及到 fit() ,如图所示,在 UI 中仅观察到一项任务:

enter image description here .

根据配置,num-executors = 1000, executor-cores = 2 .并且 RDD 合并为 2000 个分区。 mapPartitionsWithIndex需要很长时间.可以分发给多个执行者或任务吗?

最佳答案

setNumPartitions(numPartitions: Int)解决了我的问题。我没有检查默认值。
设置分区数(默认值:1)。

关于scala - 为什么 word2vec 只在 Word2Vec.scala :323 处为 mapPartitionsWithIndex 执行一项任务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44583529/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com