- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
假设我有类似下面的代码
for idx in xrange(0, 10):
train_test_split = training.randomSplit(weights=[0.75, 0.25])
train_cv = train_test_split[0]
test_cv = train_test_split[1]
# scale train_cv and test_cv
通过缩放train_cv
和test_cv
,原始数据是否会受到影响?
最佳答案
因此,实际上不可能“改变”一个 RDD 只转换它们。所以,不,原始数据不会受到影响。
关于python - randomSplit 是否返回原始 rdd 的副本或引用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29903389/
我在 PySpark 中有一个相当大的数据框 (100GB),我想将其拆分为训练集、测试集和验证集。这是关键,我在它工作之前已经完成了,但是这次尝试它时,它返回的数据帧的所有值都从实际值更改为 1 或
我正在尝试使用以下方法将数据集拆分为训练和非训练 inDataSet.randomSplit(weights.toArray, 0) 每次运行,我都会得到不同的结果。这是预期的吗?如果是这样,我怎样才
假设我有类似下面的代码 for idx in xrange(0, 10): train_test_split = training.randomSplit(weights=[0.75, 0.2
这个问题解释了 Spark 的随机拆分是如何工作的,How does Sparks RDD.randomSplit actually split the RDD ,但我不明白 spark 如何跟踪第一
这个问题解释了Spark的随机分割是如何工作的,How does Sparks RDD.randomSplit actually split the RDD ,但我不明白 Spark 如何跟踪哪些值进
嗨,我是 MLlib 的新手,我正在阅读 Spark 网站上有关它的文档。我很难理解为什么在下面的代码中我们需要缓存“0”用于训练和“1”用于测试: val splits = data.rando
所以假设我有一个包含 3000 行的 rdd。前 2000 行属于 1 类,最后 1000 行属于 2 类。RDD 分为 100 个分区。 调用RDD.randomSplit(0.8,0.2)时 该函
我用我的数据创建了一个 DataFrame 来运行一些机器学习实验。我试图通过使用 randomSplit() 函数将它分成训练集和测试集,但它给了我一些我无法弄清楚原因的异常。我的代码与此类似: F
我是一名优秀的程序员,十分优秀!